2.01.2019

Szablon Cytuj książkę w polskiej Wikipedii

Szablon Cytuj książkę w polskiej Wikipedii


Po przekopaniu się przez 1.300.000+ haseł polskiej Wikipedii, przyszedł czas na analizę danych i wyciągnięcie pierwszych wniosków.

Do uźródłowienia merytorycznych treści w Wikipediach służą przypisy.
Aby tworzenie przypisów ułatwić i nadać im ustaloną strukturę, wykorzystywana jest grupa szablonów określane nazwą szablonów cytowania.

Ważnym szablonem jest szablon o nazwie Cytuj książkę, występujący w kodzie wiki-tekstu jako {{Cytuj książkę|...}}

Ten szablon używamy, gdy informacje potwierdzające treść pierwotnie pochodzą z publikacji książkowej (w wersji elektronicznej lub nie).

Obecnie każda książka jest jednoznacznie identyfikowana przez ISBN.
Tego identyfikatora użyli autorzy zbioru danych (dataset), dla pozycji książkowych użytych w jakimkolwiek kontekście w polskiej Wikipedii.
  
Ja natomiast, we wcześniejszym poście przedstawiłem 20 książek najczęściej występujących w WP-PL w cytowaniach, na podstawie tego zbioru danych.

Teraz przedstawiam takie samo zestawienie, ale stworzone na podstawie mojego własnego zbioru danych.
Przyjęta metodologia była nieco odmienna, gdyż ja wyciągnąłem wszystkie szablony "Cytuj książkę” z haseł, a z nich następnie powyciągałem ISBNy.
Poza tym użyłem nowszego dumpa XML polskiej Wikipedii, bo z listopada 2018, a nie z marca 2018. 

Dane liczbowe:

Łączna ilość szablonów Cytuj książkę:                        535.006
Szablony Cytuj książkę zawierające ISBN:                   317.083
Szablony Cytuj książkę bez parametru "isbn":              187.323
Szablony Cytuj książkę, pusty parametr "isbn":              30.600

Pewna ilość szablonów zawierających jakąś wartość w parametrze "isbn" została odrzucona, ponieważ zawierały nieprawidłowe dane (np. ciągi znaków takie jak: "brak" lub "wtedy nie  było adnotacji o ISBN").  

Szablon Cytuj książkę Polska Wikipedia


Wyniki analizy

  1. Cichocki, Włodzimierz Polskie nazewnictwo ssaków świata (Polish names of mammals of the world), Muzeum i Instytut Zoologii PAN, Warszawa, 2015, ISBN 978-83-88147-15-9, OCLC 922215069 = 3083
  2. Paryska, Zofia Wielka encyklopedia tatrzańska, Wydawnictwo Górskie, Poronin, 1995, ISBN 83-7104-009-1, OCLC 35208429 = 2578
  3. Polak, Bogusław Polskie formacje graniczne 1918-1939 : Straż Graniczna 1918- 1939 : dokumenty organizacyjne : wybór źródeł, Wydawnictwo Uczelniane Politechniki Koszalińskiej, Koszalin ,1999, ISBN 83-87424-77-3, OCLC 49399163 =  1969
  4.  Wojewoda, Władysław Checklist of Polish larger Basidiomycetes (Krytyczna lista wielkoowocnikowych grzybów podstawkowych Polski), W. Szafer Institute of Botany, Polish Academy of Sciences, Kraków, 2003, ISBN 83-89648-09-1, OCLC 62368937 = 1571
  5. Dominiczak, Henryk Granice państwa i ich ochrona na przestrzeni dziejów : 966-1996, Wydawnictwo Bellona, Warszawa, 1997, ISBN 83-11-08618-4, OCLC 37244743 = 1390
  6. Kurzyński, Henryk Historia finałów Lekkoatletycznych Mistrzostw Polski 1920-2007 : konkurencje męskie, KAdruk Komisja Statystyczna PZLA, Szczecin-Warszawa, 2008, ISBN 978-83-61233-20-6, OCLC 751207980 = 1228
  7. Rutkowski, Lucjan Klucz do oznaczania roślin naczyniowych Polski niżowej, Wydawnictwo Naukowe PWN, Warszawa, 2007, ISBN 83-01-14342-8, OCLC 183208377 = 1138
  8. Choiński, Adam Katalog jezior Polski, Wydawnictwo Naukowe UAM, Poznań, 2006, ISBN 83-232-1732-7, OCLC 169954726 = 1039
  9. Matuszkiewicz, Władysław Przewodnik do oznaczania zbiorowisk roślinnych Polski, Wydawnictwo Naukowe PWN, 2007, Warszawa, ISBN 83-01-14439-4, OCLC 214323325 = 988
  10. Kula, Henryk  Polska straż graniczna w latach 1928-1939, Wydawnictwo Bellona, 1994, Warszawa, ISBN 83-110-826-71 = 980
  11. Kondracki, Jerzy Geografia regionalna Polski, Wydawnictwo Naukowe PWN, Warszawa, 1998, ISBN 83-01-12479-2, OCLC 40893735 = 877
  12. Mirek, Zbigniew Red list of plants and fungi in Poland (Czerwona lista roślin i grzybów Polski), W. Szafer Institute of Botany, Polish Academy of Sciences, Kraków, 2006, ISBN 83-89648-38-5, OCLC 78225357 = 861
  13. Chodkowski, Andrzej Encyklopedia muzyki,  Wydawnictwo Naukowe PWN, Warszawa, 2007, ISBN 8301113901 = 857
  14. Fros, Henryk i Sowa, Franciszek Księga imion i świętych. T. 6, W-Z,  Kraków, Wydawnictwo WAM - Księża Jezuici, 2007, ISBN 9788373187368 = 802
  15. Pawłowska, Ewa Hydronimy, Główny Urząd Geodezji i Kartografii,Warszawa, 2006, ISBN 83-239-9607-5, OCLC 749337946 = 778 
  16. Mirek, Zbigniew Czerwona księga Karpat Polskich : rośliny naczyniowe, Instytut Botaniki im. W. Szafera PAN, Kraków, 2008, ISBN 978-83-89648-71-6, OCLC 401780346 = 750
  17. Januszewski, Jarosław Tatry i Podtatrze : atlas satelitarny, 1:15 000, Geosystems Polska, Warszawa, 2005, ISBN 83-909352-2-8, OCLC 181637523 = 748
  18. Kaźmierczakowa, Róża Polska czerwona lista roślin paprotników i roślin kwiatowych (Polish red list of pteridophytes and flowering plants), Instytut Ochrony Przyrody, Polska Akademia Nauk, 2016,ISBN 9788361191889, OCLC 982380143 = 730
  19. Sula, Marek Rejon Giewontu i Czerwonych Wierchów : mapa turystyczna 1:20 000 (Tourist map, Touristenkarte, Turistická mapa), WiT, Piwniczna Zdrój, 2006, ISBN 83-89580-00-4, OCLC 839072663 = 721
  20. Gajl, Tadeusz Herbarz polski od średniowiecza do XX wieku : ponad 4500 herbów szlacheckich 37 tysięcy nazwisk 55 tysięcy rodów, L&L, Gdańsk, 2007, ISBN 978-83-60597-10-1, OCLC 233447252 = 719

Wnioski

  1. Bardzo podobna lista, w zasadzie prawie to samo. Drobne przesunięcia pod względem częstości z poprzedniej listy i 2 nowe pozycje (zaznaczone na czerwono).
  2. Najczęstsza książka została użyta w ponad 3000 szablonów "Cytuj książkę"
  3. Zestawienie nie obejmuje wszystkich książek użytych w cytowaniach
  4. Wiele szablonów "Cytuj książkę" nie zawiera ISBNa, ani OCLC ID (ponad 200.000 szablonów)
  5. Sporo szablonów "Cytuj książkę" zawiera nieprawidłowe dane jako wartość parametru isbn
  6. Pewna ilość szablonów wymaga poprawy ręcznej, zdecydowana większość może być poprawiona za pomocą botów