Lompat ke isi

Sistem peringkat Elo: Perbedaan antara revisi

Dari Wikipedia bahasa Indonesia, ensiklopedia bebas
Konten dihapus Konten ditambahkan
MerlIwBot (bicara | kontrib)
k bot Membuang: be:Рэйтынг Эло (deleted)
InternetArchiveBot (bicara | kontrib)
Add 1 book for Wikipedia:Pemastian (20231010)) #IABot (v2.0.9.5) (GreenC bot
 
(14 revisi perantara oleh 10 pengguna tidak ditampilkan)
Baris 1: Baris 1:
'''Sistem peringkat Elo''' adalah suatu metode untuk menghitung tingkat keterampilan (''skill'') relatif pemain pada permainan antara dua pemain seperti [[catur]] dan [[igo]]. Sistem ini juga digunakan sebagai sistem peringkat untuk permainan multi-pemain (''multi-player'') pada beberapa jenis [[permainan komputer]]. "Elo" sering ditulis dengan huruf kapital (ELO), tapi sebenarnya bukanlah suatu [[akronim]]. Elo berasal dari nama pencipta sistem, [[Árpád Élő]] (1903-1992), ahli fisika [[Amerika Serikat]] kelahiran [[Hungaria]].
[[File:ArpadElo.jpg|thumb|[[Arpad Elo]], pencipta sistem peringkat Elo]]'''Sistem peringkat Elo''' adalah suatu metode untuk menghitung tingkat keterampilan (''skill'') relatif pemain pada permainan jumlah-nol (''zero-sum'') seperti [[catur]] dan [[igo|go]]. "Elo" sering ditulis dengan huruf kapital (ELO), tetapi bukanlah suatu [[akronim]]. Elo berasal dari nama penciptanya, [[Arpad Elo]], ahli fisika [[Amerika Serikat]] kelahiran [[Hungaria]].


Sistem Elo diciptakan sebagai perbaikan sistem peringkat catur dari [[Sistem peringkat Harkness|sistem Harkness]] yang digunakan sebelumnya.<ref>{{Cite journal|last=Elo|first=Arpad E.|date=August 1967|title=The Proposed USCF Rating System, Its Development, Theory, and Applications|url=http://uscf1-nyc1.aodhosting.com/CL-AND-CR-ALL/CL-ALL/1967/1967_08.pdf#page=26|journal=[[Chess Life]]|volume=XXII|issue=8|pages=242–247}}</ref> Tapi sistem ini juga digunakan sebagai sistem peringkat dalam [[sepak bola]], [[Sepak bola Amerika|sepak bola Amerika (''American football)'']], [[bisbol]], [[bola basket]], [[pool]], [[tenis meja]], dan banyak [[permainan papan]] dan [[esports|olahraga elektronik (''esports)'']]''.''
== Pranala luar ==


Peringkat (''rating'') Elo seorang pemain dinyatakan dengan sebuah poin angka yang mungkin berubah, bergantung pada hasil pertandingan yang dimainkan. Pada setiap akhir pertandingan, pemenang akan mengambil poin dari yang kalah. Perbedaan peringkat antar dua pemain menentukan banyaknya poin yang didapat atau yang hilang dari sebuah pertandingan. Dua pemain dengan peringkat yang sama diprediksi (''expected'') akan mendapatkan total jumlah kemenangan yang sama, jika peringkat keduanya sama. Pemain dengan peringkat 100 poin lebih tinggi daripada lawannya diprediksi menang 64%; jika 200 poin lebih tinggi, ia diprediksi mendapatkan 76%. Dengan cara pandang lain, pemain dengan peringkat tinggi hanya mendapat sedikit poin ketika menang dari pemain peringkat-rendah. Tapi pemain dengan peringkat-rendah akan mendapatkan banyak poin jika menang dari pemain peringkat-tinggi (dan sedikit poin jika hasil pertandingannya seri/imbang). Hal ini mengakibatkan sistem peringkat Elo ''self-correcting''. Pemain dengan peringkat terlalu tinggi atau terlalu rendah, dalam jangka panjang akan berubah naik-turun menyesuaikan prediksi sistem peringkat sampai nilai peringkat menggambarkan kemampuan asli pemain tersebut.

Peringkat Elo hanya bersifat komparatif (untuk dibandingkan), dan hanya dapat dibandingkan dalam lingkungan pemain tempat peringkat tersebut dihitung (''rating pool''); Peringkat Elo tidak dapat digunakan untuk mengukur kemampuan absolut seorang pemain.

==Sejarah==
[[Arpad Elo]] adalah seorang pemain catur tingkat master dan peserta aktif dalam [[Federasi Catur Amerika Serikat|Federasi Catur Amerika Serikat (USCF)]] sejak didirikan pada tahun 1939.<ref>{{cite web|last=Redman|first=Tim|date=July 2002|title=Remembering Richard, Part II|url=http://www.springfieldchessclub.com/icbarchive/ICB_2002_07.pdf|publisher=Illinois Chess Bulletin|archive-url=https://web.archive.org/web/20200630040943/http://www.springfieldchessclub.com/icbarchive/ICB_2002_07.pdf|archive-date=2020-06-30|access-date=2020-06-30|url-status=live}}</ref> USCF menggunakan sistem peringkat numerik, yang dirancang oleh [[Kenneth Harkness]], yang memungkinkan para anggotanya mengukur kemampuan masing-masing; selain dengan melihat total menang dan kalah dalam turnamen. Sistem Harkness cukup adil, tetapi dalam beberapa situasi memunculkan peringkat yang dianggap tidak akurat oleh banyak pengamat. Atas nama USCF, Elo merancang sistem baru dengan dasar [[statistika]] yang lebih baik.<ref>{{Cite journal|last=Elo|first=Arpad E.|date=March 5, 1960|title=The USCF Rating System|url=http://uscf1-nyc1.aodhosting.com/CL-AND-CR-ALL/CL-ALL/1960/1960_03_1.pdf|journal=[[Chess Life]]|publisher=[[United_States_Chess_Federation|USCF]]|volume=XIV|issue=13|pages=2}}</ref> Pada waktu yang hampir bersamaan, György Karoly dan Roger Cook secara independen mengembangkan sistem berdasarkan prinsip yang sama untuk Asosiasi Catur New South Wales.<ref>Elo 1986, p. 4</ref>

Sistem Elo yang didasarkan pada estimasi statistika menggantikan sistem penghargaan kompetitif. Pada sistem lawas ini, poin penghargaan suatu turnamen olahraga disesuaikan dengan evaluasi subjektif atas 'kehebatan' pencapaian tertentu. Sebagai contoh, memenangkan turnamen [[golf]] internasional mungkin bernilai lima kali lipat lebih banyak poin daripada memenangkan turnamen nasional. Sebaliknya, estimasi statistika menggunakan model yang menghubungkan hasil pertandingan dengan variabel-variabel dasar yang mewakili kemampuan setiap pemain. Asumsi utama Elo adalah bahwa performa catur setiap pemain dalam setiap pertandingan adalah [[variabel acak]] yang [[Distribusi normal|terdistribusi secara normal]]. Meskipun seorang pemain mungkin tampil lebih baik atau lebih buruk secara signifikan dari satu permainan ke permainan berikutnya, Elo mengasumsikan bahwa nilai rata-rata dari penampilan pemain tertentu hanya berubah secara perlahan dari waktu ke waktu. Elo menganggap kemampuan pemain yang sebenarnya sebagai rata-rata dari variabel acak performa pemain tersebut.

Asumsi lebih lanjut diperlukan karena performa catur dalam cara pandang di atas masih belum dapat diukur. Seseorang tidak dapat melihat urutan gerakan catur dan mendapatkan angka yang mewakili keterampilan pemain tersebut. Performa hanya dapat disimpulkan dari kemenangan, seri, dan kekalahan. Oleh karena itu, jika seorang pemain memenangkan permainan, mereka diasumsikan telah tampil di level yang lebih tinggi daripada lawannya dalam permainan tersebut. Sebaliknya, jika pemain kalah, mereka diasumsikan tampil di level yang lebih rendah. Jika permainan berakhir seri, kedua pemain diasumsikan tampil pada level yang hampir sama. Elo tidak menjelaskan secara pasti seberapa dekat dua pertandingan agar dianggap seri, bukan menang atau kalah.

Untuk menyederhanakan komputasi lebih jauh, Elo mengusulkan metode yang mudah untuk memperkirakan variabel dalam modelnya (yakni, keterampilan sebenarnya dari setiap pemain). Seseorang dapat menghitung dengan relatif mudah dari tabel berapa banyak permainan yang diharapkan akan dimenangkan oleh pemain berdasarkan perbandingan peringkat mereka dengan peringkat lawan. Peringkat pemain yang memenangkan lebih banyak permainan dari yang diharapkan akan meningkat, sedangkan pemain yang memenangkan lebih sedikit dari yang diharapkan akan menurun peringkatnya. Selain itu, perubahan peringkat tersebut harus sesuai (linear) dengan jumlah kemenangan pemain yang melebihi atau kurang dari jumlah yang diharapkan.<ref>{{Cite journal|last=Elo|first=Arpad E.|date=June 1961|title=The USCF Rating System - A Scientific Achievement|url=http://uscf1-nyc1.aodhosting.com/CL-AND-CR-ALL/CL-ALL/1961/1961_06.pdf#page=8|journal=[[Chess Life]]|publisher=[[United_States_Chess_Federation|USCF]]|volume=XVI|pages=160–161|number=6}}</ref>

Dari perspektif modern, asumsi penyederhanaan Elo tidak diperlukan karena daya komputasi saat ini tidak mahal dan tersedia secara luas. Beberapa orang, terutama [[Mark Glickman]], telah mengusulkan untuk menggunakan metode statistika yang lebih canggih untuk memperkirakan variabel yang sama. Di sisi lain, kesederhanaan komputasi sistem Elo telah terbukti menjadi salah satu aset terbesarnya. Dengan bantuan kalkulator saku, seorang kompetitor catur yang memiliki informasi yang cukup dapat menghitung dengan tepat berapa peringkat mereka yang akan dipublikasikan secara resmi, yang membantu mendorong persepsi bahwa peringkat tersebut adil.

=== Penerapan sistem Elo ===
USCF menerapkan saran-saran Elo pada tahun 1960,<ref name="aboutUSCF">{{cite web|title=About the USCF|url=http://www.uschess.org/about/about.php|publisher=United States Chess Federation|archive-url=https://web.archive.org/web/20080926015601/http://www.uschess.org/about/about.php|archive-date=2008-09-26|access-date=2008-11-10|url-status=live}}</ref> dan sistem Elo dengan cepat mendapatkan pengakuan sebagai sistem yang lebih adil dan lebih akurat daripada [[sistem peringkat Harkness]]. Sistem Elo diadopsi oleh [[Fédération Internationale des Échecs|Federasi Catur Dunia (FIDE)]] pada tahun 1970.<ref>Elo 1986, Preface to the First Edition</ref> Elo menjelaskan karyanya secara rinci dalam buku ''The Rating of Chessplayers, Past and Present'', yang pertama kali diterbitkan pada tahun 1978.<ref name="AEE1986">Elo 1986.</ref>

Uji-uji statistik selanjutnya menunjukkan bahwa performa catur hampir pasti tidak [[Distribusi normal|terdistribusi secara normal]], karena pemain yang lebih lemah memiliki peluang menang yang lebih besar daripada yang diperkirakan oleh model Elo.<ref>Elo 1986, ch. 8.73.</ref><ref>Glickman, Mark E., and Jones, Albyn C., {{url|http://www.glicko.net/research/chance.pdf|"Rating the chess rating system"}} (1999), Chance, 12, 2, 21-28.</ref> Pada praktiknya, hanya ada sedikit perbedaan antara bentuk kurva logistik dan kurva normal. Jadi, tidak masalah apakah distribusi logistik atau normal yang digunakan untuk menghitung skor yang diharapkan.<ref>{{cite web|title=Deloitte Chess Rating Competition|url=http://blog.kaggle.com/2011/04/24/the-deloittefide-chess-competition-play-by-play/|archive-url=https://web.archive.org/web/20110830220456/http://blog.kaggle.com/2011/04/24/the-deloittefide-chess-competition-play-by-play/|archive-date=2011-08-30|access-date=2011-09-05|url-status=live}}</ref> Namun, secara matematis, fungsi logistik lebih mudah digunakan.<ref>Glickman, Mark E. (1995), {{url|http://www.glicko.net/research/acjpaper.pdf|"A Comprehensive Guide to Chess Ratings".}}
A subsequent version of this paper appeared in the ''American Chess Journal'', 3, pp. 59–102.</ref> FIDE tetap menggunakan tabel selisih peringkat seperti yang diusulkan oleh Elo.{{r|fiderr2017|at=table 8.1b}}

== Sistem-sistem peringkat Elo yang diterapkan ==
Istilah "Peringkat Elo" sering digunakan untuk merujuk pada peringkat catur seorang pemain yang dihitung oleh FIDE. Namun, penggunaan ini dapat ambigu karena ide-ide umum Elo telah diadopsi oleh banyak organisasi, termasuk USCF (sebelum FIDE), banyak federasi catur nasional lainnya, [[Professional Chess Association]] (PCA); juga server-server catur daring, seperti [[Internet Chess Club]] (ICC), [[Free Internet Chess Server]] (FICS), dan [[Yahoo!]] Games. Setiap organisasi memiliki implementasi yang unik, dan tidak ada satupun yang mengikuti saran asli Elo dengan tepat.

Sebagai gantinya, peringkat Elo disertai informasi mengenai organisasi yang memberikan rating. Sebagai contoh: "Pada Agustus 2002, [[Gregory Kaidanov]] memiliki peringkat FIDE 2638 dan peringkat USCF 2742." Peringkat Elo dari berbagai organisasi ini tidak selalu dapat dibandingkan secara langsung, karena peringkat Elo mengukur hasil dalam suatu kelompok pemain catur dan bukan kemampuan absolut dari semua pemain catur.

=== Pemeringkatan FIDE ===
{| class="wikitable" style="width:100px; float:right; text-align:center; margin-top:0; margin-left:10px;"
! style="width:50%;" |<math>p</math>
! style="width:50%;" |<math>d_p</math>
|-
|1.00
| +800
|-
|0.99
| +677
|-
|0.9
| +366
|-
|0.8
| +240
|-
|0.7
| +149
|-
|0.6
| +72
|-
|0.5
|0
|-
|0.4
|−72
|-
|0.3
|−149
|-
|0.2
|−240
|-
|0.1
|−366
|-
|0.01
|−677
|-
|0.00
|−800
|}
Peringkat performa (''performance rating'', PR) adalah peringkat dugaan yang dihasilkan dari permainan-permain pada hanya satu acara/turnamen. Beberapa organisasi catur{{r|uschess2020|p=p. 8}} menggunakan "''algorithm of 400''" untuk menghitung peringkat performa. Berdasarkan algoritma ini, peringkat performa untuk sebuah acara dihitung dengan cara berikut:

# Untuk setiap kemenangan: tambahkan peringkat lawan dan tambahkan dengan 400,
# Untuk setiap kekalahan: tambahkan peringkat lawan dan kurangkan dengan 400,
# Untuk setiap hasil seri: tambahkan peringkat lawan,
# Lalu bagi total perhitungan diatas dengan banyaknya permainan yang terjadi.

Sebagai contoh, seorang pemain yang menang melawan orang dengan peringkat ''w'' dan orang dengan peringkat ''x'', namun kalah dari pemain dengan peringkat ''y'' dan seri ketika melawan orang dengan peringkat ''z'', akan mendapatkan peringkat performa

: <math>
\begin{align}
PR = & \frac{(w+400)+(x+400)+(y-400)+z}{4} \\[6pt]
= & \frac{w+x+y+z+400(2)-400(1)}{4}
\end{align}
</math>

Algoritma ini adalah sebuah penyederhanaan, namun memberikan cara mudah untuk memperkirakan besar peringkat performa.

[[FIDE]], di lain pihak, menghitung peringkat performa sebagai: [[Rata-rata|rerata]] peringkat lawan-lawan ditambahkan dengan perbedaan peringkat. Perbedaan peringkat <math>d_p</math> didapatkan dari tabel dengan menentukan skor persentase <math>p</math> pemain dalam turnamen. Skor persentase ini dihitung sebagai total poin yang didapat lalu dibagi dengan banyaknya permainan yang dilakukan. Sebagai catatan, skor sempurna atau tanpa skor memiliki <math>d_p=800.</math> Tabel diruas kanan adalah versi sederhana dari tabel yang disertakan dalam manual FIDE.<ref>{{Cite web|title=B. Permanent Commissions / 02. FIDE Rating Regulations (Qualification Commission) / FIDE Rating Regulations effective from 1 July 2017 till 31 December 2021 (with amendments effective from 1 February 2021) / FIDE Handbook|url=https://handbook.fide.com/chapter/B022017|website=International Chess Federation (FIDE)|language=en|access-date=2023-02-01}}</ref>

=== Peringkat saat ini ===
[[FIDE]] memperbarui daftar peringkatnya pada setiap awal bulan. Di lain pihak, peringkat saat ini (''live ratings''), yang tidak resmi, menghitung perubahan peringkat pemain setiap akhir permainan. Peringkat ini didasarkan pada pemeringkatan yang FIDE publikasikan, sehingga ''live rating'' seorang pemain dimaksudkan untuk mengetahui berapa peringkat yang akan dihasilkan jika FIDE memperbarui daftar peringkatnya di hari itu.

==Teori==
Perbandingan perpasangan (''pairwise comparisons'') menjadi dasar metodologi pemeringkatan Elo<ref>Elo 1986, ch. 1.12.</ref>. Lebih spesifik, besarnya performa disimpulkan dari banyaknya menang, kalah, dan seri, ketika melawan pemain-pemain lain. Peringkat seorang pemain bergantung pada peringkat dari lawan-lawan mereka dan skor yang dihasilkan dari melawan mereka. Perbedaan peringkat antar dua pemain menentukan perkiraan skor harapan (''expected score'') antara keduanya; hal ini akan dijelaskan lebih lanjut. Besarnya rerata dan jangkauan dari pemeringkatan dapat dipilih sembarang. USCF awalnya berniat agar pemain klub catur yang umum, akan memiliki peringkat 1500. Elo selanjutnya menyarankan penskalaan pada pemeringkatan, agar perbedaan peringkat catur sebesar 200 poin mengartikan pemain yang lebih kuat memiliki skor harapan (dengan kata lain skor rata-rata yang diharapkan) sekitar 0,75.

''Skor harapan'' seorang pemain adalah peluang menang pemain tersebut ditambah setengah dari peluang ia menghasilkan seri. Akibatnya, skor harapan sebesar 0,75 mengartikan 75% peluang menang, 0% peluang seri, dan 25% peluang kalah. Di sisi ekstrem yang lain, skor ini juga dapat mengartikan 50% peluang menang, 50% peluang seri, dan 0% peluang kalah. Peluang hasil seri tidak didetailkan dalam sistem Elo: hasil seri dianggap setengah menang dan setengah kalah.

Secara praktik, karena kemampuan asli dari setiap pemain tidak dapat ditentukan, skor harapan diukur menggunakan skor pemain saat itu, sebagai berikut: jika pemain&nbsp;A memiliki peringkat <math>\, R_\mathsf{A} \,</math> dan pemain&nbsp;B memiliki peringkat <math>\, R_\mathsf{B} \,</math>, rumus (menggunakan [[Fungsi logistik|kurva logistik]] dengan [[Logaritma umum|basis 10]])<ref>Elo 1986, p. 141, ch. 8.4& Logistic probability as a rating basis</ref> skor harapan untuk pemain&nbsp;A adalah
:<math> E_\mathsf{A} = \frac 1 {1 + 10^{(R_\mathsf{B} - R_\mathsf{A})/400}} ~.</math>

Serupa dengan itu, skor harapan untuk pemain&nbsp;B adalah

:<math> E_\mathsf{B} = \frac 1 {1 + 10^{(R_\mathsf{A} - R_\mathsf{B})/400}} ~.</math>

Rumus tersebut dapat pula dituliskan sebagai

:<math> E_\mathsf{A} = \frac{ Q_\mathsf{A} }{ Q_\mathsf{A} + Q_\mathsf{B} } </math>

dan

:<math> E_\mathsf{B} = \frac{ Q_\mathsf{B} }{Q_\mathsf{A} + Q_\mathsf{B} } ~,</math>

dengan <math>\; Q_\mathsf{A} = 10^{R_\mathsf{A}/400} \;,</math> dan <math>\; Q_\mathsf{B} = 10^{R_\mathsf{B}/400} ~.</math> Bentuk terakhir ini mengartikan bahwa <math>\; E_\mathsf{A} + E_\mathsf{B} = 1 ~.</math> Dengan mengamati pembilang, skor harapan untuk pemain&nbsp;A adalah<math>\; Q_\mathsf{A}/Q_\mathsf{B} \;</math> lebih besar dari skor harapan untuk pemain&nbsp;B. Dapat disimpulkan pula untuk setiap perbedaan 400 poin dibandingkan lawan, skor harapan pemain meningkat 10 kali lipat dibandingkan skor harapan lawan.

Ketika skor seorang pemain dalam suatu turnamen melebihi skor harapan, sistem Elo menyimpulkan peringkat pemain tersebut terlalu rendah dan perlu ditingkatkan. Sebaliknya, jika skor seorang pemain dalam turnamen lebih rendah dari skor harapan, peringkat pemain akan diturunkan. Usulan Elo yang asli, yang masih umum digunakan, adalah menyesuaikan skor secara linear dengan perbedaan performa yang terjadi di turnamen dari yang skor harapan. Penyesuaian maksimum untuk setiap permainan, yang disebut dengan ''faktor-K'', ditetapkan sebesar<math>\; K = 16 \;</math>untuk master dan<math>\; K = 32 \;</math>untuk pemain yang lebih lemah.

Misalkan pemain A (yang memiliki peringkat <math>R_\mathsf{A}</math>) diharapkan mendapatkan skor <math>\, E_\mathsf{A} \,</math>poin namun pada kenyataannya mendapatkan<math>\, S_\mathsf{A} \,</math> poin. Rumus untuk memperbarui peringkat pemain tersebut adalah

:<math>R_\mathsf{A}' = R_\mathsf{A} + K \cdot (S_\mathsf{A} - E_\mathsf{A}) ~.</math><ref>Elo August 1967.</ref>

Pembaruan ini dapat dilakukan pada akhir setiap permainan, akhir setiap turnamen, atau akhir suatu periode pemeringkatan yang sesuai.

Berikut adalah sebuah contoh untuk memperjelas:

{{quote|1=Misalkan pemain&nbsp;A memiliki peringkat 1613 dan bermain dalam sebuah turnamen lima-ronde. Ia kalah pada pemain berperingkat 1609, seri melawan pemain berperingkat 1477, menang melawan pemain berperingkat 1388, menang melawan pemain berperingkat 1586, dan kalah melawan pemain dengan peringkat 1720. Skor asli dari pemain adalah {{nobr| (0 + 0.5 + 1 + 1 + 0) {{=}} 2.5 .}} Sedangkan skor harapan yang dihitung dengan rumus diatas, adalah {{math | (0.51 + 0.69 + 0.79 + 0.54 + 0.35)}} = 2.88.
Artinya, peringkat baru pemain adalah {{nobr| [1613 + 32·(2.5 − 2.88)] {{=}} 1601 ,}} mengasumsikan faktor-{{mvar|K}} sebesar 32 digunakan.
Walaupun dua menang, dua kalah, dan satu seri terlihat sebagai hasil yang imbang, keadaan ini lebih buruk dari skor harapan pemain&nbsp;A karena peringkat lawan-lawan mereka rata-rata lebih rendah. Akibatnya, peringkat player&nbsp;A sedikit turun. Andaikan pemain&nbsp;A mendapatkan dua menang, satu kalah, dan dua seri -- dengan total skor tiga poin --, ia bermain sedikit lebih baik dari harapan. Peringkat pemain&nbsp;A dalam kasus ini akan menjadi {{nobr| [1613 + 32·(3 − 2.88)] {{=}} 1617 .}}}}

Prosedur pembaruan ini menjadi dasar pemeringkatan yang digunakan oleh [[FIDE]], [[United States Chess Federation|USCF]], [[Yahoo! Games]], [[Internet Chess Club]] (ICC) dan [[Free Internet Chess Server]] (FICS). Akan tetapi, setiap organisasi menggunakan cara yang berbeda untuk mengurus ketidakpastian terkait pemeringkatan; khususnya peringkat untuk setiap pemain baru, dan masalah inflasi/deflasi pada pemeringkatan. Para pemain baru mendapatkan peringkat sementara (''provisional'') yang diperbaiki lebih drastis ketimbang pemain dengan peringkat yang sudah pasti.

Prinsip-prinsip dalam sistem peringkat Elo dapat digunakan untuk pemeringkatan pada cabang kompetisi yang lain, seperti pertandingan sepak bola internasional. Sistem Elo juga telah diterapkan pada permainan tanpa kemungkinan hasil seri, dan pada permainan yang memiliki besar perbedaan hasil akhir (selain sekadar menang/kalah).

=== Usulan-usulan modifikasi ===
Pada tahun 2011 setelah menganalisis 1,5 juta permainan FIDE, [[Jeff Sonas]] menunjukkan sembarang dua pemain yang memiliki perbedaan peringkat sebesar <math>X</math> menurut rumus Elo, ternyata memiliki perbedaan peringkat sekitar <math display="inline">\frac{5}{6}X.</math> Hal ini mengartikan para pemain secara konsisten kehilangan poin ketika menang, karena rumus Elo salah memprediksi hasil.<ref>https://en.chessbase.com/post/the-elo-rating-system-correcting-the-expectancy-tables</ref>

Masalah matematis pertama yang diangkat oleh USCF adalah penggunaan [[distribusi normal]]. USCF menemukan bahwa hal ini tidak secara akurat mewakili hasil aktual yang terjadi, terutama oleh para pemain yang berperingkat lebih rendah. Sebagai gantinya, mereka beralih ke model [[distribusi logistik]], yang menurut USCF lebih sesuai dengan hasil yang terjadi.<ref>Elo 1986, ch. 8.73</ref>{{citation needed|date=March 2019}} FIDE juga menggunakan pendekatan distribusi logistik.<ref name="fiderr2017">{{cite report|title=FIDE Rating Regulations effective from 1 July 2017|website=FIDE Online (fide.com)|publisher=[[FIDE]]|url=https://handbook.fide.com/chapter/B022017|access-date=2017-09-09|date=|archive-date=2019-11-27|archive-url=https://web.archive.org/web/20191127231614/https://handbook.fide.com/chapter/B022017|url-status=live}}</ref>

Masalah kedua adalah besar faktor-''K'' perlu digunakan. Ahli statistika catur [[Jeff Sonas]] percaya bahwa nilai <math>K=10</math> (untuk pemain dengan nilai di atas 2400) yang diterbitkan Elo tidak akurat. Jika koefisien faktor-''K'' ditetapkan terlalu besar, akan ada terlalu banyak sensitivitas pada beberapa kejadian terbaru, dalam artian besarnya poin yang dipertukarkan dalam setiap permainan. Dan jika nilai K terlalu rendah, sensitivitasnya akan menjadi minimal, dan sistem tidak akan merespons dengan cukup cepat terhadap perubahan tingkat performa pemain yang sebenarnya. Estimasi faktor-''K'' asli yang dilakukan Elo tidak mengikutkan basis data yang besar dan bukti-bukti statistik. Sonas menyimpulkan faktor-''K'' sebesar 24 (untuk pemain dengan peringkat diatas 2400) dapat lebih akurat karena lebih sensitif terhadap performa, dan dapat dipakai sebagai alat prediktif mengukur performa di masa depan.<ref>{{Cite web|date=2002-10-22|title=The Sonas Rating Formula – Better than Elo? |url=https://en.chessbase.com/post/the-sonas-rating-formula-better-than-elo|access-date=2023-01-13|website=Chess News|language=en}}</ref>

Beberapa situs catur daring sepertinya menghindari penetapan tiga-level faktor-''K'' yang ditentukan dari kelompok peringkat. Sebagai contoh, ICC terlihat mengadopsi nilai <math>K=32</math> yang global, kecuali ketika bermain melawan pemain dengan peringkat sementara (''provisional''). Di lain pihak, USCF (yang menggunakan [[distribusi logistik]] ketimbang [[distribusi normal]]) awalnya menetapkan faktor-''K'' berdasarkan tiga kelompok peringkat berikut:

* <math>\; K = 32 \;</math> untuk peringkat di bawah 2100,
* <math>\; K = 24 \;</math> untuk peringkat di antara 2100 dan 2400, dan
* <math>\; K = 16 \;</math> untuk peringkat diatas 2400.

Saat ini USCF menggunakan sebuah rumus yang menghitung faktor-''K'' berdasarkan beberapa faktor, seperti banyaknya permainan yang pernah dilakukan dan peringkat pemain saat ini. Besar faktor-''K'' juga diperkecil bagi pemain peringkat tinggi jika turnamen menggunakan kontrol waktu yang singkat.<ref name="uschess2020">{{cite report |title=The US Chess Rating system |date=April 24, 2017 |via=glicko.net |url=http://www.glicko.net/ratings/rating.system.pdf |access-date=16 February 2020 |archive-date=7 February 2020 |archive-url=https://web.archive.org/web/20200207072639/http://www.glicko.net/ratings/rating.system.pdf |url-status=live}}</ref> Sedangkan, FIDE menggunakan jangkauan peringkat berikut:<ref name="FideRules">{{cite report |title=FIDE Rating Regulations effective from 1&nbsp;July 2014 |date=2014-07-01 |website=FIDE Online (fide.com) |publisher=[[FIDE]] |url=http://www.fide.com/fide/handbook.html?id=172&view=article |access-date=2014-07-01 |archive-date=2014-07-01 |archive-url=https://web.archive.org/web/20140701031750/http://www.fide.com/fide/handbook.html?id=172&view=article |url-status=live}}</ref>

* <math>\; K = 40 \;</math> untuk pemain baru, sampai akhir turnamen dan total 30 permainan; juga untuk setiap pemain sampai ulang tahun ke-18, selama peringkat mereka di bawah 2300,
* <math>\; K = 20 \;</math> untuk pemain yang peringkatnya selalu dibawah 2400,
* <math>\; K = 10 \;</math> untuk pemain dengan sembarang peringkat setidaknya 2400 dan telah bermain setidaknya 30 permainan pada turnamen sebelumnya. Besar nilai ''K'' ini permanen setelah pemain mendapatkannya.

=== Penurunan formal untuk permainan menang/kalah ===
Rumus Elo dapat dihasilkan dengan menggunakan hubungan peringkat Elo dan ''stochastic gradient update'' dalam [[regresi logistik]].<ref>{{Cite journal |last=Kiraly |first=F. |last2=Qian |first2=Z. |date=2017 |title=Modelling Competitive Sports: Bradley-Terry-Elo Models for Supervised and On-Line Learning of Paired Competition Outcomes |url=https://ui.adsabs.harvard.edu/abs/2017arXiv170108055K |journal=arXiv:1701.08055}}</ref><ref name=":0">{{Cite journal |last=Szczecinski |first=Leszek |last2=Djebbi |first2=Aymen |date=2020-09-01 |title=Understanding draws in Elo rating algorithm |url=https://www.degruyter.com/document/doi/10.1515/jqas-2019-0102/html?lang=en |journal=Journal of Quantitative Analysis in Sports |language=en |volume=16 |issue=3 |pages=211–220 |doi=10.1515/jqas-2019-0102 |issn=1559-0410}}</ref> Jika kita mengasumsikan hasil permainan bersifat [[Peubah acak biner|biner]], yakni hanya dapat mengobservasi menang atau kalah, maka permasalahan pemeringkatan dapat diselesaikan lewat regresi logistik. Dalam hal ini, hasil permainan adalah [[variabel terikat]] dari [[variabel bebas]] berupa peringkat pemain, dan model yang menghubungkan keduanya bersifat probabilistik. Peluang pemain <math>\mathsf{A}</math> memenangkan permainan dimodelkan sebagai
:<math>
\Pr\{\mathsf{A}~\textrm{menang}\} = \sigma(r_{\mathsf{A,B}}), \quad \sigma(r)=\frac 1 {1 + 10^{-r/s}},
</math>

dengan <math display="inline">
r_{\mathsf{A,B}} = (R_\mathsf{A} - R_\mathsf{B})
</math> menyatakan perbedaan peringkat antara dua pemain, dan dengan menetapkan faktor penskala <math>s=400</math>. Menggunakan hukum total peluang,

:<math>
\Pr\{\mathsf{B}~\textrm{menang}\} = 1-\sigma(r_{\mathsf{A,B}})=\sigma(-r_{\mathsf{A,B}}).
</math>

Besar kerugian logistik (''log loss'') selanjutnya dihitung sebagai

:<math> \ell =
\begin{cases}
-\log \sigma(r_\mathsf{A,B}) & \textrm{jika}~ \mathsf{A}~\textrm{menang},\\
-\log \sigma(-r_\mathsf{A,B}) & \textrm{jika}~ \mathsf{B}~\textrm{menang},
\end{cases}</math>

menggunakan ''stochastic gradient descent'', fungsi kerugian tersebut diminimumkan lewat:

:<math> \begin{align}
R_{\mathsf{A}}\leftarrow R_{\mathsf{A}} - \eta \frac{\textrm{d}\ell}{\textrm{d} R_{\mathsf{A}}}\\
R_{\mathsf{B}}\leftarrow R_{\mathsf{B}} - \eta \frac{\textrm{d}\ell}{\textrm{d} R_{\mathsf{B}}}
\end{align}</math>.

dengan <math>\eta</math> menyatakan besar langkah adaptasi. Karena <math display="inline"> \frac{\textrm{d}}{\textrm{d} r}\log\sigma(r)=\frac{\log 10}{s}\sigma(-r)</math>, <math display="inline"> \frac{\textrm{d} r_{\mathsf{A,B}}}{\textrm{d} R_{\mathsf{A}}}={1}</math>, dan <math display="inline"> \frac{\textrm{d} r_{\mathsf{A,B}}}{\textrm{d} R_{\mathsf{B}}}=-1</math>, adaptasi dapat dituliskan sebagai

:<math> R_{\mathsf{A}}\leftarrow
\begin{cases}
R_{\mathsf{A}} + K \sigma(-r_{\mathsf{A,B}}) & \textrm{jika}~\mathsf{A}~\textrm{menang}\\
R_{\mathsf{A}} - K \sigma(r_{\mathsf{A,B}}) & \textrm{jika}~\mathsf{B}~\textrm{menang},
\end{cases}</math>

yang secara lebih ringkas dapat dinyatakan sebagai

:<math> R_{\mathsf{A}}\leftarrow
R_{\mathsf{A}} + K (S_{\mathsf{A}}-E_{\mathsf{A}})</math>

dengan <math> K=\eta\log10/s</math> adalah langkah adaptasi baru yang menyerap <math> \eta</math> dan <math> s</math>, <math> S_{\mathsf{A}}=1</math> jika <math> \mathsf{A}</math> menang dan <math> S_{\mathsf{A}}=0</math> jika <math> \mathsf{B}</math> menang. Skor harapan bagi pemain <math> \mathsf{A}</math> didapatkan dari <math> E_{\mathsf{A}}=\sigma(r_{\mathsf{A,B}})</math>. Serupa dengan itu, pembaruan untuk peringkat <math> R_{\mathsf{B}}</math> adalah

:<math> R_{\mathsf{B}}\leftarrow
R_{\mathsf{B}} + K (S_{\mathsf{B}}-E_{\mathsf{B}})</math>.

==Referensi==
=== Catatan kaki ===
{{reflist}}
=== Sumber ===
* {{Cite book|last=Elo|first=Arpad|author-link=Arpad Elo|title=The Rating of Chessplayers, Past and Present |url=https://archive.org/details/ratingofchesspla00unse|year=1986 |edition=Second|publisher=Arco Publishing, Inc.|place=New York |isbn=978-0-668-04721-0|orig-date=1st pub. 1978}}

==Bacaan lebih lanjut==
* {{Cite book|last=Harkness|first=Kenneth|author-link=Kenneth Harkness|title=Official Chess Handbook|publisher=McKay|year=1967}}

== Pranala luar ==
* {{en}} [http://www.chessgraphs.com Chessgraphs.com - Compare chess players' rating histories with FIDE data back to 1970]
* {{en}} [http://www.chessbase.com/newsdetail.asp?newsid=1160 Arpad Emre Elo – 100th anniversary]
* {{en}} [http://www.chessbase.com/newsdetail.asp?newsid=1160 Arpad Emre Elo – 100th anniversary]
* {{en}} [http://www.fide.com/ratings/ Official FIDE Rating List]
* {{en}} [http://www.fide.com/ratings/ Official FIDE Rating List]
* {{en}} [http://gobase.org/rating/elo.html GoBase.org: Introduction to the Elo Rating System]
* {{en}} [http://gobase.org/rating/elo.html GoBase.org: Introduction to the Elo Rating System]
* {{en}} [http://citeseer.nj.nec.com/context/344636/0 Citations for Elo, A.E. 1978. The Ratings of Chess Players: Past and Present.]
* {{en}} [http://citeseer.nj.nec.com/context/344636/0 Citations for Elo, A.E. 1978. The Ratings of Chess Players: Past and Present.]{{Pranala mati|date=Maret 2021 |bot=InternetArchiveBot |fix-attempted=yes }}
* {{en}} [http://math.bu.edu/people/mg/research.html Mark Glickman's research page, with a number of links to technical papers on chess rating systems]
* {{en}} [http://math.bu.edu/people/mg/research.html Mark Glickman's research page, with a number of links to technical papers on chess rating systems]
* {{en}} [http://www.fide.com/ratings/top.phtml FIDE's Top 100 players]
* {{en}} [http://www.fide.com/ratings/top.phtml FIDE's Top 100 players]
* {{en}} http://chess.about.com/library/weekly/aa03a25.htm
* {{en}} http://chess.about.com/library/weekly/aa03a25.htm {{Webarchive|url=https://web.archive.org/web/20080708145507/http://chess.about.com/library/weekly/aa03a25.htm |date=2008-07-08 }}
* {{en}} [http://www.eloratings.net A site that ranks national soccer teams using Elo methods]
* {{en}} [http://www.eloratings.net A site that ranks national soccer teams using Elo methods]
* {{en}} [http://www.chessworld.net A site that makes use of the BCF performance rating system for provisional rating assessment followed by the Elo rating system after that]
* {{en}} [http://www.chessworld.net A site that makes use of the BCF performance rating system for provisional rating assessment followed by the Elo rating system after that]
* {{en}} [http://www.european-go.org/rating/gormain.asp EGF Official Ratings]
* {{en}} [http://www.european-go.org/rating/gormain.asp EGF Official Ratings] {{Webarchive|url=https://web.archive.org/web/20060814181450/http://www.european-go.org/rating/gormain.asp |date=2006-08-14 }}
* {{en}} [http://www.chessbase.com/newsdetail.asp?newsid=562 Jeff Sonas: ''The Sonas Rating Formula — Better than Elo?'']
* {{en}} [http://www.chessbase.com/newsdetail.asp?newsid=562 Jeff Sonas: ''The Sonas Rating Formula — Better than Elo?'']
* {{en}} [http://www.benoni.de/schach/elo/index_e.html Eloquery with worldrankinglist and historical development since 1990]
* {{en}} [http://www.benoni.de/schach/elo/index_e.html Eloquery with worldrankinglist and historical development since 1990]
* {{en}} [http://www.scrabble-assoc.com/ratings/ National Scrabble Association ratings]
* {{en}} [http://www.scrabble-assoc.com/ratings/ National Scrabble Association ratings] {{Webarchive|url=https://web.archive.org/web/20081014175445/http://www.scrabble-assoc.com/ratings/ |date=2008-10-14 }}
* {{en}} [http://tournaments.tantrix.co.uk/ratings/rating.shtml The Elo-rating system used for Tantrix]
* {{en}} [http://tournaments.tantrix.co.uk/ratings/rating.shtml The Elo-rating system used for Tantrix] {{Webarchive|url=https://web.archive.org/web/20081004100014/http://tournaments.tantrix.co.uk/ratings/rating.shtml |date=2008-10-04 }}
{{Chess}}

{{catur-stub}}


[[Kategori:Catur]]
[[Kategori:Catur]]
[[Kategori:Sistem peringkat]]
[[Kategori:Sistem peringkat]]

[[bg:ЕЛО]]
[[br:Renk Elo]]
[[ca:Sistema de puntuació Elo]]
[[cs:Rating Elo]]
[[da:Elo-rating]]
[[de:Elo-Zahl]]
[[el:Σύστημα αξιολόγησης ΕΛΟ]]
[[en:Elo rating system]]
[[eo:Elo-nombro]]
[[es:Sistema de puntuación Elo]]
[[eu:Elo sailkapen]]
[[fi:Elo-luku]]
[[fr:Classement Elo]]
[[gd:Rangachadh Élő]]
[[gl:Elo]]
[[he:מד כושר]]
[[hu:Élő-pontrendszer]]
[[it:Elo]]
[[ja:イロレーティング]]
[[la:Elo rating]]
[[lt:Elo reitingas]]
[[mr:एलो गुणांकन पध्दत]]
[[nds:Elo-Tall]]
[[nl:Elo-rating]]
[[nn:Elo-rating]]
[[no:ELO-rating]]
[[pl:Ranking szachowy]]
[[pt:Rating ELO]]
[[ru:Рейтинг Эло]]
[[sk:ELO (rating)]]
[[sl:Rating ELO]]
[[sv:Elo-rating]]
[[tr:ELO]]
[[uk:Рейтинг Ело]]
[[vi:Hệ số Elo]]
[[zh:等级分]]

Revisi terkini sejak 12 Oktober 2023 21.40

Arpad Elo, pencipta sistem peringkat Elo

Sistem peringkat Elo adalah suatu metode untuk menghitung tingkat keterampilan (skill) relatif pemain pada permainan jumlah-nol (zero-sum) seperti catur dan go. "Elo" sering ditulis dengan huruf kapital (ELO), tetapi bukanlah suatu akronim. Elo berasal dari nama penciptanya, Arpad Elo, ahli fisika Amerika Serikat kelahiran Hungaria.

Sistem Elo diciptakan sebagai perbaikan sistem peringkat catur dari sistem Harkness yang digunakan sebelumnya.[1] Tapi sistem ini juga digunakan sebagai sistem peringkat dalam sepak bola, sepak bola Amerika (American football), bisbol, bola basket, pool, tenis meja, dan banyak permainan papan dan olahraga elektronik (esports).

Peringkat (rating) Elo seorang pemain dinyatakan dengan sebuah poin angka yang mungkin berubah, bergantung pada hasil pertandingan yang dimainkan. Pada setiap akhir pertandingan, pemenang akan mengambil poin dari yang kalah. Perbedaan peringkat antar dua pemain menentukan banyaknya poin yang didapat atau yang hilang dari sebuah pertandingan. Dua pemain dengan peringkat yang sama diprediksi (expected) akan mendapatkan total jumlah kemenangan yang sama, jika peringkat keduanya sama. Pemain dengan peringkat 100 poin lebih tinggi daripada lawannya diprediksi menang 64%; jika 200 poin lebih tinggi, ia diprediksi mendapatkan 76%. Dengan cara pandang lain, pemain dengan peringkat tinggi hanya mendapat sedikit poin ketika menang dari pemain peringkat-rendah. Tapi pemain dengan peringkat-rendah akan mendapatkan banyak poin jika menang dari pemain peringkat-tinggi (dan sedikit poin jika hasil pertandingannya seri/imbang). Hal ini mengakibatkan sistem peringkat Elo self-correcting. Pemain dengan peringkat terlalu tinggi atau terlalu rendah, dalam jangka panjang akan berubah naik-turun menyesuaikan prediksi sistem peringkat sampai nilai peringkat menggambarkan kemampuan asli pemain tersebut.

Peringkat Elo hanya bersifat komparatif (untuk dibandingkan), dan hanya dapat dibandingkan dalam lingkungan pemain tempat peringkat tersebut dihitung (rating pool); Peringkat Elo tidak dapat digunakan untuk mengukur kemampuan absolut seorang pemain.

Arpad Elo adalah seorang pemain catur tingkat master dan peserta aktif dalam Federasi Catur Amerika Serikat (USCF) sejak didirikan pada tahun 1939.[2] USCF menggunakan sistem peringkat numerik, yang dirancang oleh Kenneth Harkness, yang memungkinkan para anggotanya mengukur kemampuan masing-masing; selain dengan melihat total menang dan kalah dalam turnamen. Sistem Harkness cukup adil, tetapi dalam beberapa situasi memunculkan peringkat yang dianggap tidak akurat oleh banyak pengamat. Atas nama USCF, Elo merancang sistem baru dengan dasar statistika yang lebih baik.[3] Pada waktu yang hampir bersamaan, György Karoly dan Roger Cook secara independen mengembangkan sistem berdasarkan prinsip yang sama untuk Asosiasi Catur New South Wales.[4]

Sistem Elo yang didasarkan pada estimasi statistika menggantikan sistem penghargaan kompetitif. Pada sistem lawas ini, poin penghargaan suatu turnamen olahraga disesuaikan dengan evaluasi subjektif atas 'kehebatan' pencapaian tertentu. Sebagai contoh, memenangkan turnamen golf internasional mungkin bernilai lima kali lipat lebih banyak poin daripada memenangkan turnamen nasional. Sebaliknya, estimasi statistika menggunakan model yang menghubungkan hasil pertandingan dengan variabel-variabel dasar yang mewakili kemampuan setiap pemain. Asumsi utama Elo adalah bahwa performa catur setiap pemain dalam setiap pertandingan adalah variabel acak yang terdistribusi secara normal. Meskipun seorang pemain mungkin tampil lebih baik atau lebih buruk secara signifikan dari satu permainan ke permainan berikutnya, Elo mengasumsikan bahwa nilai rata-rata dari penampilan pemain tertentu hanya berubah secara perlahan dari waktu ke waktu. Elo menganggap kemampuan pemain yang sebenarnya sebagai rata-rata dari variabel acak performa pemain tersebut.

Asumsi lebih lanjut diperlukan karena performa catur dalam cara pandang di atas masih belum dapat diukur. Seseorang tidak dapat melihat urutan gerakan catur dan mendapatkan angka yang mewakili keterampilan pemain tersebut. Performa hanya dapat disimpulkan dari kemenangan, seri, dan kekalahan. Oleh karena itu, jika seorang pemain memenangkan permainan, mereka diasumsikan telah tampil di level yang lebih tinggi daripada lawannya dalam permainan tersebut. Sebaliknya, jika pemain kalah, mereka diasumsikan tampil di level yang lebih rendah. Jika permainan berakhir seri, kedua pemain diasumsikan tampil pada level yang hampir sama. Elo tidak menjelaskan secara pasti seberapa dekat dua pertandingan agar dianggap seri, bukan menang atau kalah.

Untuk menyederhanakan komputasi lebih jauh, Elo mengusulkan metode yang mudah untuk memperkirakan variabel dalam modelnya (yakni, keterampilan sebenarnya dari setiap pemain). Seseorang dapat menghitung dengan relatif mudah dari tabel berapa banyak permainan yang diharapkan akan dimenangkan oleh pemain berdasarkan perbandingan peringkat mereka dengan peringkat lawan. Peringkat pemain yang memenangkan lebih banyak permainan dari yang diharapkan akan meningkat, sedangkan pemain yang memenangkan lebih sedikit dari yang diharapkan akan menurun peringkatnya. Selain itu, perubahan peringkat tersebut harus sesuai (linear) dengan jumlah kemenangan pemain yang melebihi atau kurang dari jumlah yang diharapkan.[5]

Dari perspektif modern, asumsi penyederhanaan Elo tidak diperlukan karena daya komputasi saat ini tidak mahal dan tersedia secara luas. Beberapa orang, terutama Mark Glickman, telah mengusulkan untuk menggunakan metode statistika yang lebih canggih untuk memperkirakan variabel yang sama. Di sisi lain, kesederhanaan komputasi sistem Elo telah terbukti menjadi salah satu aset terbesarnya. Dengan bantuan kalkulator saku, seorang kompetitor catur yang memiliki informasi yang cukup dapat menghitung dengan tepat berapa peringkat mereka yang akan dipublikasikan secara resmi, yang membantu mendorong persepsi bahwa peringkat tersebut adil.

Penerapan sistem Elo

[sunting | sunting sumber]

USCF menerapkan saran-saran Elo pada tahun 1960,[6] dan sistem Elo dengan cepat mendapatkan pengakuan sebagai sistem yang lebih adil dan lebih akurat daripada sistem peringkat Harkness. Sistem Elo diadopsi oleh Federasi Catur Dunia (FIDE) pada tahun 1970.[7] Elo menjelaskan karyanya secara rinci dalam buku The Rating of Chessplayers, Past and Present, yang pertama kali diterbitkan pada tahun 1978.[8]

Uji-uji statistik selanjutnya menunjukkan bahwa performa catur hampir pasti tidak terdistribusi secara normal, karena pemain yang lebih lemah memiliki peluang menang yang lebih besar daripada yang diperkirakan oleh model Elo.[9][10] Pada praktiknya, hanya ada sedikit perbedaan antara bentuk kurva logistik dan kurva normal. Jadi, tidak masalah apakah distribusi logistik atau normal yang digunakan untuk menghitung skor yang diharapkan.[11] Namun, secara matematis, fungsi logistik lebih mudah digunakan.[12] FIDE tetap menggunakan tabel selisih peringkat seperti yang diusulkan oleh Elo.[13]

Sistem-sistem peringkat Elo yang diterapkan

[sunting | sunting sumber]

Istilah "Peringkat Elo" sering digunakan untuk merujuk pada peringkat catur seorang pemain yang dihitung oleh FIDE. Namun, penggunaan ini dapat ambigu karena ide-ide umum Elo telah diadopsi oleh banyak organisasi, termasuk USCF (sebelum FIDE), banyak federasi catur nasional lainnya, Professional Chess Association (PCA); juga server-server catur daring, seperti Internet Chess Club (ICC), Free Internet Chess Server (FICS), dan Yahoo! Games. Setiap organisasi memiliki implementasi yang unik, dan tidak ada satupun yang mengikuti saran asli Elo dengan tepat.

Sebagai gantinya, peringkat Elo disertai informasi mengenai organisasi yang memberikan rating. Sebagai contoh: "Pada Agustus 2002, Gregory Kaidanov memiliki peringkat FIDE 2638 dan peringkat USCF 2742." Peringkat Elo dari berbagai organisasi ini tidak selalu dapat dibandingkan secara langsung, karena peringkat Elo mengukur hasil dalam suatu kelompok pemain catur dan bukan kemampuan absolut dari semua pemain catur.

Pemeringkatan FIDE

[sunting | sunting sumber]
1.00 +800
0.99 +677
0.9 +366
0.8 +240
0.7 +149
0.6 +72
0.5 0
0.4 −72
0.3 −149
0.2 −240
0.1 −366
0.01 −677
0.00 −800

Peringkat performa (performance rating, PR) adalah peringkat dugaan yang dihasilkan dari permainan-permain pada hanya satu acara/turnamen. Beberapa organisasi catur[14]:p. 8 menggunakan "algorithm of 400" untuk menghitung peringkat performa. Berdasarkan algoritma ini, peringkat performa untuk sebuah acara dihitung dengan cara berikut:

  1. Untuk setiap kemenangan: tambahkan peringkat lawan dan tambahkan dengan 400,
  2. Untuk setiap kekalahan: tambahkan peringkat lawan dan kurangkan dengan 400,
  3. Untuk setiap hasil seri: tambahkan peringkat lawan,
  4. Lalu bagi total perhitungan diatas dengan banyaknya permainan yang terjadi.

Sebagai contoh, seorang pemain yang menang melawan orang dengan peringkat w dan orang dengan peringkat x, namun kalah dari pemain dengan peringkat y dan seri ketika melawan orang dengan peringkat z, akan mendapatkan peringkat performa

Algoritma ini adalah sebuah penyederhanaan, namun memberikan cara mudah untuk memperkirakan besar peringkat performa.

FIDE, di lain pihak, menghitung peringkat performa sebagai: rerata peringkat lawan-lawan ditambahkan dengan perbedaan peringkat. Perbedaan peringkat didapatkan dari tabel dengan menentukan skor persentase pemain dalam turnamen. Skor persentase ini dihitung sebagai total poin yang didapat lalu dibagi dengan banyaknya permainan yang dilakukan. Sebagai catatan, skor sempurna atau tanpa skor memiliki Tabel diruas kanan adalah versi sederhana dari tabel yang disertakan dalam manual FIDE.[15]

Peringkat saat ini

[sunting | sunting sumber]

FIDE memperbarui daftar peringkatnya pada setiap awal bulan. Di lain pihak, peringkat saat ini (live ratings), yang tidak resmi, menghitung perubahan peringkat pemain setiap akhir permainan. Peringkat ini didasarkan pada pemeringkatan yang FIDE publikasikan, sehingga live rating seorang pemain dimaksudkan untuk mengetahui berapa peringkat yang akan dihasilkan jika FIDE memperbarui daftar peringkatnya di hari itu.

Perbandingan perpasangan (pairwise comparisons) menjadi dasar metodologi pemeringkatan Elo[16]. Lebih spesifik, besarnya performa disimpulkan dari banyaknya menang, kalah, dan seri, ketika melawan pemain-pemain lain. Peringkat seorang pemain bergantung pada peringkat dari lawan-lawan mereka dan skor yang dihasilkan dari melawan mereka. Perbedaan peringkat antar dua pemain menentukan perkiraan skor harapan (expected score) antara keduanya; hal ini akan dijelaskan lebih lanjut. Besarnya rerata dan jangkauan dari pemeringkatan dapat dipilih sembarang. USCF awalnya berniat agar pemain klub catur yang umum, akan memiliki peringkat 1500. Elo selanjutnya menyarankan penskalaan pada pemeringkatan, agar perbedaan peringkat catur sebesar 200 poin mengartikan pemain yang lebih kuat memiliki skor harapan (dengan kata lain skor rata-rata yang diharapkan) sekitar 0,75.

Skor harapan seorang pemain adalah peluang menang pemain tersebut ditambah setengah dari peluang ia menghasilkan seri. Akibatnya, skor harapan sebesar 0,75 mengartikan 75% peluang menang, 0% peluang seri, dan 25% peluang kalah. Di sisi ekstrem yang lain, skor ini juga dapat mengartikan 50% peluang menang, 50% peluang seri, dan 0% peluang kalah. Peluang hasil seri tidak didetailkan dalam sistem Elo: hasil seri dianggap setengah menang dan setengah kalah.

Secara praktik, karena kemampuan asli dari setiap pemain tidak dapat ditentukan, skor harapan diukur menggunakan skor pemain saat itu, sebagai berikut: jika pemain A memiliki peringkat dan pemain B memiliki peringkat , rumus (menggunakan kurva logistik dengan basis 10)[17] skor harapan untuk pemain A adalah

Serupa dengan itu, skor harapan untuk pemain B adalah

Rumus tersebut dapat pula dituliskan sebagai

dan

dengan dan Bentuk terakhir ini mengartikan bahwa Dengan mengamati pembilang, skor harapan untuk pemain A adalah lebih besar dari skor harapan untuk pemain B. Dapat disimpulkan pula untuk setiap perbedaan 400 poin dibandingkan lawan, skor harapan pemain meningkat 10 kali lipat dibandingkan skor harapan lawan.

Ketika skor seorang pemain dalam suatu turnamen melebihi skor harapan, sistem Elo menyimpulkan peringkat pemain tersebut terlalu rendah dan perlu ditingkatkan. Sebaliknya, jika skor seorang pemain dalam turnamen lebih rendah dari skor harapan, peringkat pemain akan diturunkan. Usulan Elo yang asli, yang masih umum digunakan, adalah menyesuaikan skor secara linear dengan perbedaan performa yang terjadi di turnamen dari yang skor harapan. Penyesuaian maksimum untuk setiap permainan, yang disebut dengan faktor-K, ditetapkan sebesaruntuk master danuntuk pemain yang lebih lemah.

Misalkan pemain A (yang memiliki peringkat ) diharapkan mendapatkan skor poin namun pada kenyataannya mendapatkan poin. Rumus untuk memperbarui peringkat pemain tersebut adalah

[18]

Pembaruan ini dapat dilakukan pada akhir setiap permainan, akhir setiap turnamen, atau akhir suatu periode pemeringkatan yang sesuai.

Berikut adalah sebuah contoh untuk memperjelas:

Misalkan pemain A memiliki peringkat 1613 dan bermain dalam sebuah turnamen lima-ronde. Ia kalah pada pemain berperingkat 1609, seri melawan pemain berperingkat 1477, menang melawan pemain berperingkat 1388, menang melawan pemain berperingkat 1586, dan kalah melawan pemain dengan peringkat 1720. Skor asli dari pemain adalah (0 + 0.5 + 1 + 1 + 0) = 2.5 . Sedangkan skor harapan yang dihitung dengan rumus diatas, adalah (0.51 + 0.69 + 0.79 + 0.54 + 0.35) = 2.88.

Artinya, peringkat baru pemain adalah [1613 + 32·(2.5 − 2.88)] = 1601 , mengasumsikan faktor-K sebesar 32 digunakan.

Walaupun dua menang, dua kalah, dan satu seri terlihat sebagai hasil yang imbang, keadaan ini lebih buruk dari skor harapan pemain A karena peringkat lawan-lawan mereka rata-rata lebih rendah. Akibatnya, peringkat player A sedikit turun. Andaikan pemain A mendapatkan dua menang, satu kalah, dan dua seri -- dengan total skor tiga poin --, ia bermain sedikit lebih baik dari harapan. Peringkat pemain A dalam kasus ini akan menjadi [1613 + 32·(3 − 2.88)] = 1617 .

Prosedur pembaruan ini menjadi dasar pemeringkatan yang digunakan oleh FIDE, USCF, Yahoo! Games, Internet Chess Club (ICC) dan Free Internet Chess Server (FICS). Akan tetapi, setiap organisasi menggunakan cara yang berbeda untuk mengurus ketidakpastian terkait pemeringkatan; khususnya peringkat untuk setiap pemain baru, dan masalah inflasi/deflasi pada pemeringkatan. Para pemain baru mendapatkan peringkat sementara (provisional) yang diperbaiki lebih drastis ketimbang pemain dengan peringkat yang sudah pasti.

Prinsip-prinsip dalam sistem peringkat Elo dapat digunakan untuk pemeringkatan pada cabang kompetisi yang lain, seperti pertandingan sepak bola internasional. Sistem Elo juga telah diterapkan pada permainan tanpa kemungkinan hasil seri, dan pada permainan yang memiliki besar perbedaan hasil akhir (selain sekadar menang/kalah).

Usulan-usulan modifikasi

[sunting | sunting sumber]

Pada tahun 2011 setelah menganalisis 1,5 juta permainan FIDE, Jeff Sonas menunjukkan sembarang dua pemain yang memiliki perbedaan peringkat sebesar menurut rumus Elo, ternyata memiliki perbedaan peringkat sekitar Hal ini mengartikan para pemain secara konsisten kehilangan poin ketika menang, karena rumus Elo salah memprediksi hasil.[19]

Masalah matematis pertama yang diangkat oleh USCF adalah penggunaan distribusi normal. USCF menemukan bahwa hal ini tidak secara akurat mewakili hasil aktual yang terjadi, terutama oleh para pemain yang berperingkat lebih rendah. Sebagai gantinya, mereka beralih ke model distribusi logistik, yang menurut USCF lebih sesuai dengan hasil yang terjadi.[20][butuh rujukan] FIDE juga menggunakan pendekatan distribusi logistik.[13]

Masalah kedua adalah besar faktor-K perlu digunakan. Ahli statistika catur Jeff Sonas percaya bahwa nilai (untuk pemain dengan nilai di atas 2400) yang diterbitkan Elo tidak akurat. Jika koefisien faktor-K ditetapkan terlalu besar, akan ada terlalu banyak sensitivitas pada beberapa kejadian terbaru, dalam artian besarnya poin yang dipertukarkan dalam setiap permainan. Dan jika nilai K terlalu rendah, sensitivitasnya akan menjadi minimal, dan sistem tidak akan merespons dengan cukup cepat terhadap perubahan tingkat performa pemain yang sebenarnya. Estimasi faktor-K asli yang dilakukan Elo tidak mengikutkan basis data yang besar dan bukti-bukti statistik. Sonas menyimpulkan faktor-K sebesar 24 (untuk pemain dengan peringkat diatas 2400) dapat lebih akurat karena lebih sensitif terhadap performa, dan dapat dipakai sebagai alat prediktif mengukur performa di masa depan.[21]

Beberapa situs catur daring sepertinya menghindari penetapan tiga-level faktor-K yang ditentukan dari kelompok peringkat. Sebagai contoh, ICC terlihat mengadopsi nilai yang global, kecuali ketika bermain melawan pemain dengan peringkat sementara (provisional). Di lain pihak, USCF (yang menggunakan distribusi logistik ketimbang distribusi normal) awalnya menetapkan faktor-K berdasarkan tiga kelompok peringkat berikut:

  • untuk peringkat di bawah 2100,
  • untuk peringkat di antara 2100 dan 2400, dan
  • untuk peringkat diatas 2400.

Saat ini USCF menggunakan sebuah rumus yang menghitung faktor-K berdasarkan beberapa faktor, seperti banyaknya permainan yang pernah dilakukan dan peringkat pemain saat ini. Besar faktor-K juga diperkecil bagi pemain peringkat tinggi jika turnamen menggunakan kontrol waktu yang singkat.[14] Sedangkan, FIDE menggunakan jangkauan peringkat berikut:[22]

  • untuk pemain baru, sampai akhir turnamen dan total 30 permainan; juga untuk setiap pemain sampai ulang tahun ke-18, selama peringkat mereka di bawah 2300,
  • untuk pemain yang peringkatnya selalu dibawah 2400,
  • untuk pemain dengan sembarang peringkat setidaknya 2400 dan telah bermain setidaknya 30 permainan pada turnamen sebelumnya. Besar nilai K ini permanen setelah pemain mendapatkannya.

Penurunan formal untuk permainan menang/kalah

[sunting | sunting sumber]

Rumus Elo dapat dihasilkan dengan menggunakan hubungan peringkat Elo dan stochastic gradient update dalam regresi logistik.[23][24] Jika kita mengasumsikan hasil permainan bersifat biner, yakni hanya dapat mengobservasi menang atau kalah, maka permasalahan pemeringkatan dapat diselesaikan lewat regresi logistik. Dalam hal ini, hasil permainan adalah variabel terikat dari variabel bebas berupa peringkat pemain, dan model yang menghubungkan keduanya bersifat probabilistik. Peluang pemain memenangkan permainan dimodelkan sebagai

dengan menyatakan perbedaan peringkat antara dua pemain, dan dengan menetapkan faktor penskala . Menggunakan hukum total peluang,

Besar kerugian logistik (log loss) selanjutnya dihitung sebagai

menggunakan stochastic gradient descent, fungsi kerugian tersebut diminimumkan lewat:

.

dengan menyatakan besar langkah adaptasi. Karena , , dan , adaptasi dapat dituliskan sebagai

yang secara lebih ringkas dapat dinyatakan sebagai

dengan adalah langkah adaptasi baru yang menyerap dan , jika menang dan jika menang. Skor harapan bagi pemain didapatkan dari . Serupa dengan itu, pembaruan untuk peringkat adalah

.

Referensi

[sunting | sunting sumber]

Catatan kaki

[sunting | sunting sumber]
  1. ^ Elo, Arpad E. (August 1967). "The Proposed USCF Rating System, Its Development, Theory, and Applications" (PDF). Chess Life. XXII (8): 242–247. 
  2. ^ Redman, Tim (July 2002). "Remembering Richard, Part II" (PDF). Illinois Chess Bulletin. Diarsipkan dari versi asli (PDF) tanggal 2020-06-30. Diakses tanggal 2020-06-30. 
  3. ^ Elo, Arpad E. (March 5, 1960). "The USCF Rating System" (PDF). Chess Life. USCF. XIV (13): 2. 
  4. ^ Elo 1986, p. 4
  5. ^ Elo, Arpad E. (June 1961). "The USCF Rating System - A Scientific Achievement" (PDF). Chess Life. USCF. XVI (6): 160–161. 
  6. ^ "About the USCF". United States Chess Federation. Diarsipkan dari versi asli tanggal 2008-09-26. Diakses tanggal 2008-11-10. 
  7. ^ Elo 1986, Preface to the First Edition
  8. ^ Elo 1986.
  9. ^ Elo 1986, ch. 8.73.
  10. ^ Glickman, Mark E., and Jones, Albyn C., "Rating the chess rating system" (1999), Chance, 12, 2, 21-28.
  11. ^ "Deloitte Chess Rating Competition". Diarsipkan dari versi asli tanggal 2011-08-30. Diakses tanggal 2011-09-05. 
  12. ^ Glickman, Mark E. (1995), "A Comprehensive Guide to Chess Ratings". A subsequent version of this paper appeared in the American Chess Journal, 3, pp. 59–102.
  13. ^ a b FIDE Rating Regulations effective from 1 July 2017. FIDE Online (fide.com) (Laporan). FIDE. Diarsipkan dari versi asli tanggal 2019-11-27. Diakses tanggal 2017-09-09. 
  14. ^ a b The US Chess Rating system (PDF) (Laporan). April 24, 2017. Diarsipkan dari versi asli (PDF) tanggal 7 February 2020. Diakses tanggal 16 February 2020 – via glicko.net. 
  15. ^ "B. Permanent Commissions / 02. FIDE Rating Regulations (Qualification Commission) / FIDE Rating Regulations effective from 1 July 2017 till 31 December 2021 (with amendments effective from 1 February 2021) / FIDE Handbook". International Chess Federation (FIDE) (dalam bahasa Inggris). Diakses tanggal 2023-02-01. 
  16. ^ Elo 1986, ch. 1.12.
  17. ^ Elo 1986, p. 141, ch. 8.4& Logistic probability as a rating basis
  18. ^ Elo August 1967.
  19. ^ https://en.chessbase.com/post/the-elo-rating-system-correcting-the-expectancy-tables
  20. ^ Elo 1986, ch. 8.73
  21. ^ "The Sonas Rating Formula – Better than Elo?". Chess News (dalam bahasa Inggris). 2002-10-22. Diakses tanggal 2023-01-13. 
  22. ^ FIDE Rating Regulations effective from 1 July 2014. FIDE Online (fide.com) (Laporan). FIDE. 2014-07-01. Diarsipkan dari versi asli tanggal 2014-07-01. Diakses tanggal 2014-07-01. 
  23. ^ Kiraly, F.; Qian, Z. (2017). "Modelling Competitive Sports: Bradley-Terry-Elo Models for Supervised and On-Line Learning of Paired Competition Outcomes". arXiv:1701.08055. 
  24. ^ Szczecinski, Leszek; Djebbi, Aymen (2020-09-01). "Understanding draws in Elo rating algorithm". Journal of Quantitative Analysis in Sports (dalam bahasa Inggris). 16 (3): 211–220. doi:10.1515/jqas-2019-0102. ISSN 1559-0410. 

Bacaan lebih lanjut

[sunting | sunting sumber]

Pranala luar

[sunting | sunting sumber]