Indeks Jaccard
Tampilan
Indeks Jaccard (disebut juga koefisien kemiripan Jaccard) adalah ukuran kemiripan dan keragaman himpunan sampel. Indeks ini dikembangkan oleh Paul Jaccard (awalnya bernama coefficient de communauté)[1] dan dirumuskan secara mandiri oleh T. Tanimoto.[2] Karenanya, istilah indeks Tanimoto atau koefisien Tanimoto juga dipakai dalam bidang-bidang tertentu. Namun, keduanya juga secara umum mengambil rasio Irisan per Gabungan (bahasa Inggris: Intersection over Union/IoU). Indeks ini bisa diukur sebagai berikut:
Kemiripan atribut biner tak simetri
[sunting | sunting sumber]Bagian ini kosong. Anda bisa membantu dengan melengkapinya. |
Klasifikasi biner
[sunting | sunting sumber]Bagian ini kosong. Anda bisa membantu dengan melengkapinya. |
Lihat pula
[sunting | sunting sumber]- Koefisien tumpang-tindih (koefisien Szymkiewicz–Simpson)
- Koefisien pencocokan sederhana (koefisien kemiripan Rand/SMC)
- Jarak Hamming
- Koefisien Sørensen–Dice (indeks Sørensen/koefisien Dice)
- Indeks Tversky
- Korelasi
- Informasi bersama (MI)
Referensi
[sunting | sunting sumber]- ^ Jaccard, Paul (Februari 1912). "The Distribution of the Flora in the Alpine Zone". New Phytologist (dalam bahasa Inggris). 11 (2): 37–50. doi:10.1111/j.1469-8137.1912.tb05611.x. ISSN 0028-646X.
- ^ Tanimoto, T.T. (17 November 1958). "An Elementary Mathematical theory of Classification and Prediction". Internal IBM Technical Report. 1957 (8?).
Bacaan lebih lanjut
[sunting | sunting sumber]- Tan, P.N., Steinbach, M., dan Kumar, V. (2005). Introduction to Data Mining. ISBN 0-321-32136-7.
- Jaccard, P. (1901). "Étude comparative de la distribution florale dans une portion des Alpes et des Jura". Bulletin de la Société vaudoise des sciences naturelles. 37: 547–579.
- Jaccard, P. (1912). "The Distribution of the flora in the alpine zone". New Phytologist. 11 (2): 37–50. doi:10.1111/j.1469-8137.1912.tb05611.x.