Ubistva i kretanje izbeglica na
Kosovu 3. januar 2002. Patrick Ball, Wendy Betts, Fritz Sheuren, Jana Dudukovich i Jana Asher
AMERIČKO UDRUŽENJE ZA NAUČNI NAPREDAK Ovde sadrani materijali pretstavljaju miljenja autora i urednika i ne mogu se smatrati stavom Programa za nauku i ljudska prava Američkog udruenja za naučni napredak (American Association for the Advancement in Science – AAAS) ili Srednjoevropske i istočnoevropske pravne inicijative Američke advokatske komore (American Bar Association Central and East European Law Initiative – ABA/CEELI) ili neke od organizacija učesnica. AAAS-ov Komitet za naučnu slobodu i odgovornost (Committee on Scientific Freedom and Responsibility – CSFR), u skladu sa svojim mandatom i politikom Udruenja, podrava izdavanje ovog izvetaja kao naučnog doprinosa ljudskim pravima. Interpretacije i zaključci pripadaju autorima i ne pretstavljaju stanovita Odbora AAAS-a, Veća, CSFR-a ili članova Udruenja. Isto tako, ovde izneta stanovita nisu odobrili Poslanički dom ili Odbor guvernera ABA-e, pa se stoga ne moe smatrati da pretstavljaju politiku ABA-e. Nita sadrano u ovoj publikaciji ne treba smatrati pravnim savetom za konkretne slučajeve, te su čitaoci odgovorni za dobijanje takvih saveta od sopstvenih pravnih savetnika. Ova publikacija, kao i sve ovde sadrane formulacije i stavovi namenjeni su isključivo za obrazovne i informativne svrhe. Autorsko pravo 2002 Kontakt: Telefon: 202 326 6600 Ubistva i kretanje izbeglica na Kosovu od marta do juna 1999:
analiza i zaključci 2 3. Statistička analiza kretanja izbeglica. 4 4. Statistička analiza ubistava. 5 4.1. Procena ukupnog broja ubistava. 5 4.2. Obrasci ubistava tokom vremena. 7 4.3. Kretanje izbeglica i ubistava prema geografskoj lokaciji 7 5. Ispitivanje predloenih hipoteza. 8 5.1. Aktivnost Oslobodilačke vojske Kosova. 10 5.2. Vazduni udari NATO-a. 11 5.3. Dejstvo aktivnosti OVK i vazdunih udara NATO-a. 11 Dodatak 1: Podaci i sravnjivanje. 14 2.1. Srednjoevropska i istočnoevropska pravna inicijativa Američke advokatske komore (ABA/CEELI) 15 2.3. Human Rights Watch (HRW) 17 2.4. Organizacija za evropsku bezbednost i saradnju (OEBS) 18 3. Početno uređivanje podataka. 18 3.2. Uređivanje podataka o imenu i polu. 19 3.3. Formatiranje datuma smrti 20 4. Početno sravnjivanje podataka. 20 4.1. Promenljive veličine korićene za intrasistemsko sravnjivanje pojedinačnih zapisa. 21 4.2. Osnovni pristup intrasistemskom sravnjivanju pojedinačnih zapisa. 21 4.3. Intersistemsko sravnjivanje pojedinačnih zapisa. 23 4.4. Intra- i intersistemska obrada anonimnih grupnih zapisa. 24 4.5. Objedinjavanje podataka o anonimnim grupnim ubistvima između sistema. 25 5. Pročićavanje postupka uređivanja i sravnjivanja. 25 5.1. Nedoslednosti u sravnjivanju. 26 5.2. Izbor "najboljih" datuma. 26 5.4. Ostala uređivanja konačno utvrđenih podudarnosti 27 6. Konačni saetak rezultata podataka. 28 6.1. Obrada podataka prema izvoru za pojedinačne zapise. 28 6.2. Obrada podataka među izvorima za imenovane, pojedinačne zapise. 28 6.3. Procena potpunosti pojedinačnih podataka. 29 Dodatak 2: Statistička metodologija i analiza. 31 1.1. Ograničenja direktnih opaanja. 31 2.1. Procena dvojnih sistema. 33 2.2. Procena trojnih sistema. 34 2.3. Procena viestrukih sistema. 37 3.1. Analiza eksploratornih podataka. 39 3.2. Prilagođavanje i izbor modela za ukupan broj ubistava. 41 3.3. Agregacija unakrsnih klasifikacionih tabela za objanjenje oskudnosti 41 3.4. Globalno prilagođavanje modela među svim vremensko-prostornim tačkama. 44 3.5. Modeliranje po delovima među vremenskim i prostornim tačkama. 45 3.7. Poređenje rezultata globalnog i pojedinačnog modeliranja. 47 5.1. Analiza osetljivosti izvetaja o datumu smrti 55 5.2. Saetak zaključaka modeliranja. 57 Dodatak 3: Dodatni izvori za aktivnosti OVK i NATO-a. 58 Odbor za stručnu recenziju. 65 U ovoj studiji pretstavljeni su rezultati analize statističkih obrazaca kretanja izbeglica i ubistava na Kosovu u periodu od marta do juna 1999. Podaci su dobijeni iz evidencije albanske pogranične policije u kojima su registrovana lica koja su ulazila u Albaniju preko sela Morina /Morinë/; razgovora koje su obavili Srednjoevropska i istočnoevropska pravna inicijativa Američke advokatske komore (ABA/CEELI) i njeni partneri; razgovora koje je obavio Human Rights Watch (HRW); razgovora koje je obavila Organizacija za evropsku bezbednost i saradnju (OEBS); te izvetaja o ekhumacijama koje su sproveli međunarodni timovi u ime Međunarodnog krivičnog suda za bivu Jugoslaviju (MKSJ). Ove analize se odnose na ukupni procenjeni broj ubistava i ukupni broj izbeglica koje su napustile svoje domove prema vremenu i mestu. Zaključak ovog izvetaja je da su se ubistva i kretanje izbeglica odvijali po pravilnom obrascu koji karakteriu tri faze. U svakoj fazi, nakon velikog broja ubistava i izbeglica usledio bi znatno manji broj ubistava i izbeglica. Ovi nalazi su potom korićeni za procenu tri moguća objanjenja za taj obrazac.
U ovoj studiji zaključeno je sledeće:
Ubistva i kretanje izbeglica na Kosovu od marta do juna 1999: analiza i zaključci
1. Svrha izvetajaU ovoj studiji pretstavljeni su rezultati analize statističkih obrazaca kretanja izbeglica i ubistava na Kosovu u periodu od marta do juna 1999. Ova analiza podataka opisuje procenjeni ukupni broj ubijenih, te ukupni broj izbeglica koje su napustile svoje domove prema vremenu i mestu. Cilj analize je da se uporede tri hipoteze o mogućim uzrocima ubistava i kretanja izbeglica da bi se utvrdilo koje hipoteze analiza pobija, a koje potvrđuje. 1.1. HipotezeU studiji se prvo ispituje da li je postojala pravilna struktura ubijanja i kretanja izbeglica. Stoga je naa prva hipoteza
Ako analiza podataka podrava Hipotezu 1, postoje tri moguća objanjenja za obrazac.
Iako mogu postojati i druga objanjenja za pravilne obrasce ubijanja i kretanja izbeglica, smatram da su ova tri najverovatnija. Hipoteze su jasno razdvojene. Iako se nuno međusobno ne isključuju, svaka od hipoteza u odeljcima 2.1-2.3 implicira drukčiju odgovornost. Statističkom analizom nije moguće dokazati da je ijedna od ovih hipoteza definitivan uzrok obrazaca vidljivih u dva oblika nasilja. Međutim, kao to će se videti, moguće je pronaći podatke koji pobijaju neke hipoteze, a podupiru druge hipoteze. 1.2. Podaci i analizaPodaci za ovaj projekat doli su iz nekoliko izvora.
Statistička analiza ubistava objedinjuje informacije iz vie od 15.000 razgovora i izvetaja o ekshumaciji.[2] Analiza uključuje statističku procenu ubistava o kojima nije obavećen nijedan od četiri izvora.[3] 1.3. Glavni nalaziOvim izvetajem utvrđeno je slede}e:
Svaki od ovih nalaza objanjen je u narednim poglavljima. 2. Identifikovanje obrascaStruktura obrazaca kretanja izbeglica i ubistava tokom vremenskog perioda o kome se ovde radi pretstavlja ključnu komponentu za nalaze ove studije. U ovom kontekstu, obrazac znači niz jasno određenih kretanja sa tendencijom rasta ili pada broja izbeglica i ubijenih, za koja je jasno da nisu slučajna,. Dva ili vie obrazaca smatraju se sličnim ako pokazuju iste visoke i niske tačke u istim (ili skoro istim) vremenskim periodima. Statistički je neuverljiva pretpostavka da su obrasci na kakve ukazuju ovi nalazi rezultat ad hoc odlučivanja ili nasumičnih spoljnih uzroka. Povezane, gotovo istovremene varijacije drutvenih pojava koje su merene (ubistava i kretanja izbeglica) prema vremenu i mestu izrazito ukazuju na postojanje zajedničkog, sistematskog uzroka čiji su rezultat ovi obrasci. Identifikovanje obrasca samo po sebi niti potvrđuje niti pobija Hipoteze 2.1, 2.2. ili 2.3. Međutim, ono ne ide u prilog tvrdnji da su ubistva i kretanje izbeglica bili slučajni. To znači da postojanje obrasca izrazito ukazuje na to da je postojao zajednički uzrok, te da se ubistva i kretanje izbeglica nisu odvijali nezavisno. 3. Statistička analiza kretanja izbeglicaU ovom odeljku opisuje se odlazak etničkih Albanaca sa Kosova od kraja marta do maja 1999.[5] Priblino 95% izbeglih kosovskih Albanaca ulo je u Albaniju između 24. marta i 11. maja (Ball 2000, str. 5). Analiza kretanja ovih izbeglica tokom ovog perioda pokazuje obrazac naglih uspona nakon kojih bi usledili nagli padovi. Jedna ranija analiza odlaska izbeglica iz njihovih domova pokazala je da su od kraja marta do kraja maja 1999. etnički Albanci naputali svoje domove na Kosovu tokom tri odvojena perioda ili faze (vidi sliku 1). Te faze su bile slede}e: od 24. marta do 6. aprila; od 7. aprila do 23. aprila; i od 24. aprila do 11. maja.[6] Bitna karakteristika ove fazne strukture jeste prisutsvo niskih urednosti u broju izbeglica koje su naputale svoje domove od 6. do 8. aprila i od 23. do 25. aprila, odnosno datumi prelaska iz jedne faze u drugu.[7] Te niske tačke su značajne jer ne traju due vreme, a prethode im i slede ih izraziti skokovi. Drugim rečima, tokom ova dva prelazna intervala, pojava naputanja domova gotovo nestaje, za razliku od visokih brojki koje su opaene za vreme dotičnih faza.
Slika 1: Procenjeno ukupno kretanje izbeglica tokom vremena
24. mart 6. april 24. april 11. maj
Kao to pokazuje Slika 1, tokom prelaznog intervala između dve faze, od 6. do 8. aprila, broj izbeglica pada na priblino 6.000, u odnosu na svoju najviu vrednost iz prve faze kada je iznosio neto preko 52.000. Tokom prelaznog intervala između faza, od 23. do 25. aprila, broj izbeglica pada na priblino 1.000, dok je na vrhuncu druge faze iznosio vie od 16.000. U trećoj fazi javljaju se dve najve}e vrednosti od priblino 8.000 i 6.000 početkom maja, koje pretstavljaju poslednje talase izbeglica. Kretanje izbeglica opada na manje od 100 ljudi po dvodnevnom intervalu nakon 11. maja. Ova ekstremna fluktuacija između visokih i niskih vrednosti čini obrazac kretanja izbeglica. Migracija koja je rezultat disperzivnih, decentralizovanih uzroka ne bi pokazivala jasne razlike između momenata kretanja visokog i niskog intenziteta. Da je pojava naputanja domova bila nesistematična, distribucija brojeva u tom vremenskom periodu bila bi ujednačenija, uz eventualne manje skokove. Ekstremni, jasno definisani skokovi koji su opaeni u ovoj analizi ne mogu se desiti slučajno. Masovni egzodus kosovskih Albanaca ovih razmera i sa ovakvim obrascem mogao je biti podstaknut jedino zajedničkim uzrokom. 4. Statistička analiza ubistavaU ovom odeljku se opisuje broj i obrazac ubistava koja su se desila na Kosovu od kraja marta do sredine juna 1999. Analiza podataka o ubistvima pokazuje da je, prema procenama, ubijeno 10.356 civila kosovskih Albanaca, te da su obrasci ubijanja slični obrascima kretanja izbeglica. Kao i kod kretanja izbeglica, zaključujemo da statistički obrasci ubistava ukazuju na postojanje zajedničkog uzroka. 4.1. Procena ukupnog broja ubistavaPre nego to razmotrimo gde i kada su se desila ubistva, potrebno je najpre proceniti ukupan broj ubistava koja su se desila tokom ovog vremenskog perioda. Nekoliko koraka preduzeto je kako bi se izvrila ova procena. Kao prvo, ukupan broj pojedinačnih rtava, sa dokumentovanim imenima, uvrten je u tabele. Popisane su sve rtve koje su u jednom ili vie izvora podataka identifikovane imenom; upoređene su deskriptivne informacije o rtvama kako bi se uklonili duplikati, a ukupan broj pojedinaca se poklapao.[8] Od oko 10.000 `rtava evidentiranih poimence, ovim postupkom identifikovano je 4.400 pojedinaca. Broj od 4.400 nije procena, nego stvaran broj individualno prijavljenih rtava.
Slika 2. Procena ukupne migracije izbeglica i ubistava tokom vremena
24. mart 6. april 24. april 11. maj 22. jun
Drugo, budući da rtve navedene u izvorima podataka nisu bile jedine rtve ubistava, bilo je potrebno proceniti broj nedokumentovanih rtava kako bi se izvrila opta procena ukupnog broja poginulih. Ovaj broj, 10.356, dobijen je pomoću mnogo korićene demografske statističke tehnike poznate pod imenom "procena viestrukih sistema", koja se oslanja na uzorke populacije.[9] Budući da je opta procena od 10.356 poginulih dobijena iz uzoraka – a ne iz (nepoznate) savrene liste poginulih – potrebno je izračunati marginu greke. Naa procena je da taj interval iznosi od 9.002 do 12.122. Valja primetiti da su procena i margina greke u skladu sa procenama rtava ubijanja na Kosovu iz ranijih radova ABA-e i AAAS-a, kao i sa procenama koje se navode u drugim, nezavisnim studijama.[10]
Slika 3: Regioni Kosova
Sever
Leposavić /Leposaviq/ Zvečan Kosovska Mitrovica /Mitrovicë/ Zubin Potok Vučitrn /Vushtrri/ Srbica /Skenderaj/ Obilić /Obiliq/ Glogovac /Gllogoc/
Zapad
Istok /Istog/ Peć /Pejë/ Klina /Kline/ Dečani /Decar/ Orahovac /Rahovec/ Đakovica /Gjakovë/
Jug
Suva Reka /Suharekë/ Prizren /Përzeren/ [trpce /Shterpce/ Gora /Dragashi/
Istok
Kosovo Polje /Fushë Kosovë/ Pritina /Prishtinë/ Kosovska Kamenica /Kamenica/ Novo Brdo /Novobërdë/ Lipljan /Lipjan/ Gnjilane /Gjilan/ Štimlje /Shtirme/ Uroevac /Ferizaj/ Vitina /Viti/ Kačanik /Kaçanik/
4.2. Obrasci ubistava tokom vremenaKada se razmotri procenjeni broj rtava tokom vremena, koristeći iste dvodnevne intervale koji su upotrebljeni za podatke o izbeglicama, opaeni obrazac ubistava veoma liči na obrazac kretanja izbeglica. Analiza je pretstavljena na Slici 2. Podaci pokazuju vrhunac u broju ubistava krajem marta, a drugi vrhunac sredinom aprila. Najvanije je primetiti da, kao i kod podataka o kretanju izbeglica, pojava ubistava opada gotovo na nulu u periodu od 6. do 7. aprila i ponovo od 22. do 24. aprila. Prema tome, ne samo da broj ubijenih pokazuje iste ekstremne kontraste između visokih i niskih vrednosti kao to je slučaj sa kretanjem izbeglica, nego se te visoke i niske vrednosti javljaju gotovo u isto vreme kao i kod kretanja izbeglica. Ovi skokovi ne bi se javili slučajno, pa stoga zaključujemo da su posledica zajedničkog uzroka. 4.3. Kretanje izbeglica i ubistava prema geografskoj lokacijiUz ispitivanje vremena kada su se deavala kretanja izbeglica i ubistva, vano je razmotriti gde se to događalo. Analiza mesta odakle je poteklo kretanje izbeglica i gde su se dogodila ubistva pokazuje iroko rasprostranjen obrazac koji odgovara nasilju koje je povezano sa raseljavanjem. Kad se broj ljudi koji su napustili svoje domove i broj ubijenih analizira na regionalnom nivou, mogu da se identifikuju ekstremni kontrasti između visokih i niskih vrednosti koji slede fazni obrazac sličan onome koji je opisan gore, u optoj analizi (vidi Slike 4-7). Relativni obrasci prema vremenu i prostoru su slični. U svim regionima, datumi od 6. do 7. i od 22. do 24. aprila označavaju niske vrednosti u kretanju izbeglica i u broju ubijenih ljudi. U jednoj ranijoj analizi kretanja izbeglica opaeno je da je vie od tri četvrtine izbeglica koje su prele u Albaniju tokom Faze 1 poteklo iz junih i zapadnih delova Kosova, dok je za vreme Faze 2, vie od tri četvrtine izbeglica poteklo iz severnih i istočnih delova Kosova (Ball 2000). Slike 4-7 pokazuju da ubistva slede sličan obrazac. Ubistva u zapadnim i junim delovima desila su se prvenstveno za vreme Faze 1; za vreme docnijih faza, bilo je relativno manje ubistava u ta dva regiona. U severnim i istočnim regionima, ubistava je takođe bilo za vreme Faze 1. Međutim, u ovim regionima, za razliku of junih i zapadnih regiona, takođe je ubijan značajan broj lica za vreme Faze 2.[11] Kao to pokazuju ovi grafikoni, ne samo da obrasci kretanja izbeglica i ubistava pokazuju slične karakteristike tokom vremena, nego su obrasci slični i za različite regione. Iako, kada se gleda izolovano, lokalna kretanja izbeglica i ubistva mogu izgledati kao lokalna reakcija na lokalni uzrok, gledano sa zbirnog aspekta, statistička analiza otkriva obrazac koji podrazumeva zajednički uzrok. Drugim rečima, ubistva i egzodus izbeglica deavali su se na istim mestima i otprilike u isto vreme. Analiza pokazuje da su se ovi događaji odvijali prema sličnim obrascima u svakom od četiri regiona. Analiza ne dokazuje ta je bio uzrok bilo kojeg od obrazaca, niti da je jedan obrazac izazvao drugog. Međutim, analiza pokazuje da su činovi nasilja – ubistva – bili vremenski i prostorno povezani sa odlascima izbeglica iz njihovih domova. 5. Ispitivanje predloenih hipotezaKao to je gore navedeno, statistike ne dokazuju da je neki konkretan proces prouzrokovao obrasce kretanja izbeglica ili masovnog ubijanja. Ipak, analiza moe pokazati da li su hipoteze u skladu sa statističkim dokazima ili ih ovi pobijaju. Navedene su tri hipoteze o uzrocima obrazaca kretanja izbeglica i ubistava. Ove tri hipoteze su aktivnost OVK, vazduni udari NATO-a i sistematska kampanja koju su sprovodile jugoslovenske snage. Moguće je upotrebiti statističke metode da bi se ispitao odnos između aktivnosti OVK i vazdunih udara NATO-a i gore opisanih obrazaca. Ako se aktivnost OVK ili vazduni udari doga|aju neposredno pre ili za vreme perioda intenzivnog ubijanja i migracije, ovi događaji mogu pretstavljati verovatan uzrok rastućeg i opadajućeg obrasca. Međutim, ako vazduni udari i aktivnost OVK ne prethode vrhuncu ubistava ili kretanja izbeglica, tada uzročno-posledični odnos valja dovesti u pitanje ili odbaciti. Analiza aktivnosti OVK i vazdunih udara NATO-a prema vremenu i mestu pokazuje da se nijedna od njih nije desila u vreme i na mestima gde bi bili primarni uzork kretanja izbeglica i ubistava.
Slika 4: Procena ukupne migracije izbeglica i ubistava tokom vremena, severni region
24. mart 6. april 24. april 11. maj 22. jun
Slika 5: Procena ukupne migracije izbeglica i ubistava tokom vremena, juni region
24. mart 6. april 24. april 11. maj 22. jun
Slika 6: Procena ukupne migracije izbeglica i ubistava tokom vremena, istočni region
24. mart 6. april 24. april 11. maj 22. jun
Slika 7: Procena ukupne migracije izbeglica i ubistava tokom vremena, zapadni region
24. mart 6. april 24. april 11. maj 22. jun
Slika 8: Vremensko poređenje napada OVK sa ubistvima i kretanjem izbeglica
Da bi analizirali pojavu aktivnosti OVK ili NATO-a u odnosu na obrazac ubistava i kretanja izbeglica, koristili smo sledeću proceduru. Za svaku optinu na Kosovu hronoloki smo beleili, po dvodnevnim periodima, broj izbeglica koje su napustile domove, broj prijavljenih ubistava i pojavu aktivnosti OVK i NATO-a.[12] Za ovu analizu, aktivnost OVK uključivala je i borbe, kao i izolovana ubistva Srba. Identifikovani su dvodnevni periodi koji su označavali vrhunce kretanja izbeglica i ubistava. Ako je do aktivnosti OVK ili NATO-a dolo u istom periodu ili u periodu od dva dana pre vrhunca, zaključili smo da se ta dva događaja podudaraju. Ako aktivnost OVK ili NATO-a nije zabeleena pre vrhunca, zaključili smo da je aktivnost OVK ili NATO-a usledila tek posle vrhunca. Ako se aktivnost OVK ili NATO-a javila vie od dva dana pre vrhunca, računato je da optina ima obrazac iz kojeg ne moe nita da se zaključi. Da bismo testirali zaključke izvedene ovom metodom, upotrebili smo drugu statističku metodu kojom smo ispitali zajedničke korelacije između aktivnosti OVK i NATO-a i obrazaca kretanja izbeglica i ubistava. Svrha korićenja druge statisičke tehnike je da se kontrolie korelacija između aktivnosti OVK i vazdunih udara NATO-a, te broja ubistava i kretanja izbeglica na prostornom i vremenskom planu. 5.1. Aktivnost Oslobodilačke vojske KosovaPodaci o aktivnosti OVK dobijeni su putem razgovora i niza nevladinih izvetaja koje je MKSJ saeo i dostavio za ovaj projekat.[13] Koristeći ove informacije, pri istraivanju je izračunat broj zabeleenih borbi između OVK i jugoslovenskih snaga koje su se tokom vremena odvijale u svakoj optini. Nije računat intenzitet pojedinih borbi, ali su odvojeni vatreni okraji brojani posebno. Izolovani napadi OVK koji su za posledicu imali ranjavanje, nestanak ili smrt etničkih Srba takođe su uvrteni u tabelu prema broju rtava. To su brojke o prijavljenim srpskim rtvama, a ne procene. Podaci su bili nedovoljni za procenu ukupnog broja nestalih.
Slika 9: Vremensko poređenje vazdunih udara NATO-a sa ubistvima i kretanjem izbeglica
Kako zahteva testiranje hipoteza, prijavljena aktivnost OVK poređena je sa ubistvima i kretanjem izbeglica za svaku od 29 optina na Kosovu. Rezultat ove analize vremenskih podudaranja prikazan je na Slici 8, koja pokazuje da se u 11 od 29 optina, odnosno 38%, aktivnost OVK podudarala sa optim vrhuncem u broju ubistava, ili da se odvijala unutar dvodnevnog intervala pre vrhunca. U 12 optina, odnosno 41%, aktivnost OVK usledila je ili posle vrhunca u broju ubistava ili se uopte nije javila. U est optina, odnosno 21%, nije bilo moguće izvesti zaključke iz obrasca. Kretanje izbeglica ima sličan obrazac. U 10 optina, odnosno 34%, aktivnost OVK podudarala se sa optim vrhuncem kretanja izbeglica, ili se odvijala unutar dvodnevnog intervala pre vrhunca. U 11 optina, odnosno 38%, aktivnost OVK usledila je ili posle vrhunca kretanja izbeglica ili se uopte nije javila. U preostalih osam optina, odnosno 28%, aktivnost OVK javila se u vremenskim tačkama koje se podudaraju s ostalim visokim, niskim ili prelaznim tačkama u broju ubistava ili kretanju izbeglica. Da bi aktivnost OVK uzrokovala obrazac koji je opaen kod ubistava i kretanja izbeglica, pojava aktivnosti morala bi prethoditi visokim vrednostima. Međutim, ova analiza pokazuje da je aktivnost OVK sledila nakon vrhunaca broja ubistava i izbeglica na vie mesta nego to im je prethodila. Stoga nema jasnog uzročno-posledičnog odnosa između aktivnosti OVK i ovde opisanog obrasca. 5.2. Vazduni udari NATO-aU ovoj analizi razmatra se broj vazdunih udara NATO-a kako su izvestili jugoslovenski dravni izvori.[14] Nije se nastojalo da se utvrdi jačina svakog vazdunog napada, nego su izvetaji o različitim vazdunim napadima računati odvojeno. Kao i kod aktivnosti OVK, prijavljeni vazduni udari poređeni su sa ubistvima i kretanjem izbeglica za svaku od 29 optina na Kosovu. U samo tri optine, odnosno 10%, vazduni udari NATO-a poklopili su se sa pojavom najvi}ih vrednosti u broju ubistava, ili su se odvijali unutar dvodnevnog intervala pre tog vrhunca. U 20 optina, odnosno 69%, vazduni udari NATO-a javili su se ili posle vrhunca u broju ubistava ili se uopte nisu javili, a u est optina, odnosno 21%, obrazac ne upućuje ni na kakav zaključak. Obrazac kretanja izbeglica nije tako neujednačen, ali upućuje na iste zaključke. U devet optina, odnosno 31%, vazduni udari NATO-a podudarali su se sa najviim vrednostima broja izbeglica, ili su se odvijali unutar dvodnevnog intervala pre tog vrhunca. U 13 optina, odnosno 45%, vazduni udari izvedeni su ili poto su brojke koje se odnose na kretanje izbeglica dostigle vrhunac ili se uopte nisu javili. U preostalih sedam optina, odnosno 24%, vazduni udari NATO-a javili su se u drugo vreme i podudarali se s ostalim visokim, niskim ili prelaznim tačkama u broju ubistava ili kretanju izbeglica. Jo jedna činjenica koju valja naglasiti u vezi s vazdunim napadima NATO-a jeste da su od 2. do 4. aprila napadi bili uveliko smanjeni zbog loeg vremena.[15] Uprkos tome, u ovom periodu u kome je bilo relativno malo vazdunih udara NATO-a, prisutne su izrazito visoke vrednosti u broju ubistava i kretanju izbeglica irom Kosova. Kao i kod nalaza zasnovanih na podacima o OVK, analiza podataka o NATO-u pokazuje da su vazduni udari čeće sledili nakon to bi broj ubistava i izbeglica dostigao vrhunac nego to su im prethodili. Stoga hipoteza da su vazduni udari NATO-a direktno ili indirektno prouzrokovali obrasce ubistava i kretanja izbeglica treba da se odbaci.
Slika 10: Procena ukupnog broja ubistava i ostataka tokom vremena
24. mart 6. april 24. april 11. maj 22.jun 5.3. Dejstvo aktivnosti OVK i vazdunih udara NATO-aUz prethodnu analizu, podaci su takođe sabrani na regionalnim nivoima, a obrasci tokom vremena za svaki od četiri regiona analizirani su zajedno s obrascima ubistava i kretanja izbeglica. Cilj je bio da se ispita obrazac ubistava nakon to se ukloni statistička korelacija s aktivnoću OVK i vazdunim udarima NATO-a. Drugim rečima, ova analiza razmatra zajedničko dejstvo aktivnosti OVK i NATO-a pomoću procene broja ubistava predskazanog statističkom interakcijom podataka o OVK i NATO-u, te oduzimanjem te procene od originalnog obrasca. Rezultat tog oduzimanja naziva se "ostatak" i on daje obrazac ubistava i kretanja izbeglica koji ostaje posle uklanjanja dejstva kontrolnih promenljivih veličina (aktivnost OVK i NATO-a). Rezultat ove analize prikazan je na Slici 10. Na Slici 10, gornja linija pretstavlja ukupan procenjeni broj rtava tokom vremena kao to je pokazano na Slici 2. Nia linija na Slici 10 je isti obrazac, uz kontrolisanje statističkog uticaja obrazaca OVK i NATO-a.[16] Kada se poniti uticaj korelacija s vazdunim udarima NATO-a i aktivnoću OVK, obrazac ubistava tokom vremena ostaje sutinski nepromenjen. Sve vrhunske vrednosti su iste, iako su neke od ni`ih vrednosti neto ve}e na donjoj liniji.
Slika 11: Procena ukupnog kretanja izbeglica i ostataka tokom vremena
24. mart 6. april 24. april 11. maj 25. maj
Ista analiza moe se primeniti na kretanje izbeglica. Rezultati su prikazani na Slici 11. Kao i kod ubistava, obrazac kretanja izbeglica, uz kontrolisanje statističkog uticaja obrazaca OVK i NATO-a, veoma je sličan originalnom obrascu. Međutim, statistička merenja ukazuju na to da aktivnost OVK (ali ne i vazduni udari NATO-a) imaju slabu, ali primetnu vezu sa obrascem kretanja izbeglica.[17] Ta veza je posebno vidljiva na dvema tačkama u vremenskom nizu: tokom Faze 1 u severnom regionu i tokom prelaza iz Faze 1 u Fazu 2 u istočnom regionu. U ova dva regiona u te dve vremenske tačke, ostatak obrasca odstupa od obrasca procenjenog kretanja izbeglica. Osim ovih dvaju izuzetaka, aktivnost OVK i NATO-a imaju malo uticaja na obrazac kretanja izbeglica. Analiza obrazaca ubistava i kretanja izbeglica, uz kontrolisanje uticaja aktivnosti OVK i vazdunih udara NATO-a pokazuje da, iako mogu postojati povremene podudarnosti, opte dejstvo aktivnosti OVK i vazdunih udara NATO-a znatno ne menja obrasce ubistava i kretanja izbeglica. To prua dalje dokaze za odbacivanje hipoteze da su aktivnost OVK ili vazduni udari NATO-a prouzrokovali ubistva ili kretanje izbeglica. 5.4. Jugoslovenske snageSada ćemo da razmotrimo treću hipotezu – da su jugoslovenske snage organizovale i sprovele sistematsku kampanju nasilja koja je za posledicu imala ubistva i kretanje izbeglica: statistička analiza korelacija ne moe da dokae da su jugoslovenske snage bile onaj spoljanji uticaj koji je bio odgovoran za opaene obrasce. Međutim, nalazi ove studije u saglasnosti su s hipotezom da je akcija jugoslovenskih snaga bila uzrok ubistava i kretanje izbeglica. Posebno jedan od nalaza ove studije ukazuje na vezu između aktivnosti Jugoslovenske vojske i opaenog obrasca ubistava i kretanja izbeglica. Ekstremno opadanje broja ubistava i izbeglica zapaeno u periodu od 6. do 7. aprila podudara se s jednostranim prekidom vatre koje su jugoslovenske vlasti objavile povodom pravoslavnog Uskrsa.[18] Tokom perioda kada su jugoslovenske snage prekinule neprijateljstva, broj ubistava i izbeglica koje su naputale domove drastično je opao. Dalje veze mogu se povući ako se pokae da je do pokreta jugoslovenskih trupa dolazilo prema istim obrascima kao i u slučaju ubistva i kretanja izbeglica. Međutim, takva analiza prelazi okvire ove studije. 6. Saetak zaključakaU skladu s ranijim analizama, nalazi ove studije pokazuju da su se ubistva i kretanje izbeglica odvijali u talasima. Tokom vremena, kretanje izbeglica koje su naputale domove javljalo se u različitim regionima Kosova, i odvijalo se u intenzivnim periodima, koji su međusobno razgraničeni periodima mnogo nieg stepena kretanja. Kao to pokazuje Slika 2, obrasci ubistava kroz vreme slede obrasce kretanja izbeglica. Tako obrasci ubistava i kretanja izbeglica pokazuju karakteristike koje upućuju na postojanje spoljanjeg uzroka. Taj nalaz podupire opaanje da su se ova dva procesa odvijala zajedno. U ovoj studiji takođe su analizirani obrasci ova dva niza tokom vremena i prema regionu. Kada se ukupne procene uporede na regionalnom nivou, ostaje jasan odnos između obrazaca kretanja izbeglica i ubistava. Tako su se kretanje izbeglica i ubistva deavali na istim mestima i u isto vreme, to ukazuje na zajednički uzrok obe ove pojave. Analiza takođe pokazuje da dve hipoteze koje su predloene da bi se objasnili obrasci ubistava i migracija, odnosno aktivnost OVK i NATO-a, nisu u saglasnosti s opaenim obrascima kretanja izbeglica i ubistava. I aktivnost OVK i vazduni udari NATO-a čeće su se deavali nakon najvećeg broja ubistava i najvećeg nivoa kretanja izbeglica nego pre tih kulminacija. Uz kontrolisanje statističkog dejstva aktivnosti OVK i vazdunih udara NATO-a, obrasci ubistava i kretanja izbeglica tokom vremena ostali su sutinski nepromenjeni. Analiza je u saglasnosti sa hipotezom da su jugoslovenske vlasti sprovodile kampanju ubistava i proterivanja. Prekid vatre povodom Uskrsa koji je proglasila jugoslovenska vlada potpuno se podudara sa drastičnim smanjenjem broja ubistava i kretanja izbeglica, a taj nalaz pojačava saglasnost analize s ovom hipotezom. Svaki od ovih nalaza u saglasnosti je s narativnim saoptenjima o situaciji na Kosovu tokom ovog perioda koje su davale brojne nevladine organizacije. Koherentnost faza, blizak odnos između procenjenog broja ubistava i kretanja izbeglica, te njihova pojava irom Kosova idu u prilog tvrdnji da je postojao koordiniran uzrok nasilja nad etničkim Albancima u periodu od marta do juna 1999.
Dodatak 1: Podaci i sravnjivanje Ova studija se zasniva na zbiru vie od 62.000 prijavljenih smrtnih slučajeva, od kojih je priblino 52.000 bilo anonimno.[19] Imena 9.569 ljudi bila su prijavljena jednoj ili vie organizacija koje su prikupljale informacije o ubistvima na Kosovu u periodu od marta do juna 1999. U Dodatku 1 opisuje se kako smo obrađivali izvetaje o anonimnim i imenovanim smrtnim slučajevima. Kao to će se videti, ova dva tipa podataka pretstavljaju sasvim različite izazove. Ovaj Dodatak podeljen je u odeljke, počevi od Uvoda (koji predstavlja Odeljak 1). U Odeljku 2 opisujemo procedure prikupljanja podataka koje su obezbedile osnovne ulazne podatke za na rad. U Odeljku 3 detaljno se razmatraju koraci pri početnom uređivanju podataka kada se podaci pročićavaju i pripremaju za analizu. U sledećem odeljku (Odeljak 4) opisuju se nai početni pokuaji da identifikujemo viestruke izvetaje o istom smrtnom slučaju. U Odeljku 5 opisujemo kako smo u drugom krugu preispitali podudarnost podataka. Konačni podaci rezimirani su u poslednjem odeljku Dodatka 1 (Odeljak 6). Podaci koji su analizirani u ovoj studiji prikupljeni su iz četiri izvora: razgovora koje su obavili Srednjoevropska i istočnoevropska pravna inicijativa Američke advokatske komore (ABA/CEELI), Human Rights Watch (HRW) i Organizacija za evropsku bezbednost i saradnju (OEBS), kao i izvetaja o ekhumacijama koje su sastavili međunarodni timovi u ime Međunarodnog krivičnog suda za bivu Jugoslaviju (EXH). Opti saeci projekata prikazani su na Slici 1. Prvi red rezimira rad na prikupljanju podataka od strane ABA/CEELI. Oni su obavili 1.674 razgovora u kojima je prijavljeno o 5.089 ubistava. Svoje prikupljanje podataka su obavili u pet zemalja. Posljednji stubac tabele uključuje oznaku "Da" koja znači da su svi koji su prikupljali podatke za ABA/CEELI koristili standardizovan anketni formular.
Slika 1: Saetak izvora podataka
S uoptenijeg aspekta, za svaki izvor, oznaka "incident" moe da uključi informacije o smrti vie od jednog lica. U jednom razgovoru, svedok moe da opie jedan ili vie takvih incidenata. Prema tome, incident jeste izvetaj jednog lica identifikovanog po imenu ili jednog anonimnog lica ili grupe ljudi koji nisu posebno identifikovani. Kod ubistava prijavljenih od jedinstvenog izvora, različiti svedoci često su prijavljivali smrt istih rtava. Neki svedoci identifikovali su rtve poimence, navodeći za svaku rtvu njegovo ili njeno puno ime i prezime[20], starost i pol, kao i datum i mesto smrti. Druge rtve identifikovane su isključivo anonimno. Postoje izvetaji o pojedinačnim rtvama, no bez imena ("Video sam le starca"). Druge rtve identifikovane su kao članovi neke grupe ("Video sam deset leeva na hrpi pored druma"). Tela koja su ekshumirana ali nikad nisu identifikovana, takođe su uvrtena u ovu kategoriju. Te se rtve nazivaju grupama (čak i ako je u "grupi" samo jedna rtva). 2.1. Srednjoevropska i istočnoevropska pravna inicijativa Američke advokatske komore (ABA/CEELI) Izvori 1.674 razgovora koji sačinjavaju podatke ABA/CEELI razlikovali su se prema zemlji gde su podaci prikupljeni, sa različitim partnerima u svakoj zemlji. Zemlje gde su obavljani razgovori uključivale su Albaniju, Makedoniju, Sjedinjene Američke Drave, Poljsku i Kosovo u Jugoslaviji. Albanija: ABA/CEELI obavio je 35% razgovora u Albaniji, gde su sarađivali sa koalicijom lokalnih albanskih nevladinih organizacija pod nazivom Centar za mir putem pravde. Zajedno s ovim Centrom, ABA/CEELI je obavljao razgovore u izbegličkim logorima i među izbeglicama smetenim u privatnim kućama irom Albanije. Prikupljanje podataka u Albaniji počelo je u maju 1999. a dovreno je u avgustu 1999. U logorima su lica koja su vodila razgovore traila ispitanike od atora do atora. Makedonija: ABA/CEELI je oko 16% razgovora obavio u Makedoniji. Među ispitanicima su bili Kosovski Albanci smeteni kod porodica-domaćina irom Makedonije, ali su razgovori prvenstveno vođeni u izbegličkim logorima. Pri tome je ABA/CEELI radio s timom etničkih Albanaca, gra|ana Makedonije. ABA/CEELI je ostvarivao kontakte za razgovore putem preporuka humanitarnih organizacija, usmenih saoptenja i oglasa u lokalnim novinama. U logorima su traili ispitanike od atora do atora. Prikupljanje podataka u Makedoniji počelo je u maju 1999. i zavrilo se u avgustu 1999. SAD i Poljska: Američki advokati su uz pomoć prevodilaca razgovarali s izbeglicama smetenim u vojnoj bazi Fort Dix u New Jerseyju. ABA/CEELI je 10% svojih razgovore obavio u Fort Dixu, a ispitanici su pronađeni putem oglasa i usmenih informacija u logoru. Prikupljanje podataka u SAD započelo je u maju 1999. i zavrilo se u julu 1999. CEELI je takođe obavio broj razgovora (4) u jednom izbegličkom logoru u Poljskoj i dobio manji broj informacija iz razgovora koje je obavila Kosovska diplomatska posmatračka misija u Poljskoj. Jugoslavija: ABA/CEELI sarađivao je s dvema organizacijama na Kosovu na prikupljanju informacija nakon jugoslovenskog povlačenja u junu 1999. godine; razgovori vo|eni na Kosovu sačinjavaju 38% ukupnih razgovora koje je obavio ABA/CEELI. Centar za mir putem pravde počeo je sa prikupljanjem podataka u avgustu 1999, a zavrio u novembru 1999, i to u sledećim optinama: Đakovici, Glogovcu, Klini, Mitrovici, Peći, Podujevu /Podujevë/, Pritini, Prizrenu, Orahovcu, Suvoj Reci, Vučitrnu, te u nekolicini drugde na Kosovu. Dodatne podatke prikupilo je Veće za odbranu ljudskih prava i sloboda. Njihovi su intervjui započeti u julu 2000. a zavreni u avgustu 2000. Razgovori su vođeni u optim centrima za prikupljanje informacija u sreditima sledećih gradova: Gnjilane, Vučitrn, Kačanik, Uroevac i Štimlje. Svi razgovori vođeni su uz pomoć standardizovanog formulara koji je dozvoljavao i narativan opis događaja. Informacije iz formulara unoene su u bazu podataka. Tim za kodiranje posebnu je panju poklanjao preciznosti datuma koji su navodili ispitanici. Neki datumi su tačno identifikovani, dok su drugi identifikovani relativno ("dve nedelje pre nego to smo napustili dom") ili priblino ("neko vreme pre nego to su doli Srbi"). Kodiranje preciznosti datuma docnije je korićeno za analizu osetljivosti nalaza na pogreke u saoptavanju datuma.[21] Za statističke svrhe ove studije, svi podaci su prekategorisani iz originalne baze podataka u nove strukture podataka. Svi su podaci ponovo kodirani iz svojih orginalnih formata u standardne geografske klasifikacije i kodove preciznosti datuma. Podaci ABA/CEELI obrađivani su u dva dela: prvi deo podataka uključivao je 634 razgovora obavljena provedena na Kosovu. Ovi su podaci poređeni i potpuno nezavisno integrisani s podacima HRW-a, OEBS-a i ekshumacionim podacima kako je opisano u Odeljku 4. Drugi skup podataka ABA/CEELI (koji je uključivao razgovore obavljene izvan Kosova) iskorićen je u jednoj ranijoj publikaciji koju su izdali ABA/CEELI i AAAS (2000). Ovih 1.040 razgovora su sravnjeni sami sa sobom, a zatim integrisani sa celim skupom podataka (koji je uključivao podatke OEBS-a, HRW-a, ekshumacije i ABA/CEELI podatke iz prvog skupa). Druga faza rada ABA/CEELI sprovedena je na kraju procesa intersistemskog sravnjivanja (vidi Odeljak 4 i Odeljak 5). 2.2. Ekshumacije (EXH) Ekshumacije su vrene na mestima gde se smatralo da postoje grobnice kosovskih Albanaca ubijenih u mesecima pre povlačenja jugoslovenskih snaga. Iako ekshumacije nisu bile ravnomerno raspoređene po Kosovu, sprovedene su u 24 od 29 kosovskih optina. Ukupan broj ekshumiranih tela i broj identifikovanih za svaku optinu navedeni su na Slici 2. Podaci o ekshumacijama nisu uključivali datum kada je rtva ubijena, pa ovi podaci imaju beleku o datumu samo ako odgovaraju rtvama iz nekog drugog sistema podataka (vidi Odeljak 5). Mesto ekshumacije moe, ali ne mora da bude mesto gde je rtva ubijena. Identifikacije su paljivo vrene, pa su ekshumacioni podaci posebno vaan izvor za proveru da li se isto ime ponavlja. Mnogi ljudi na Kosovu imaju slična prezimena, pa stoga moe da bude teko razlikovati ljude samo prema prezimenu.[22]
Slika 2: Ukupan broj ekshumiranih i procenat identifikovanih tela po optinima
Od marta do juna 1999, HRW je razgovarao s izbeglicama po naputanju Kosova. Od svih ispitanika koji su dali izjave HRW-u, sa 25% je razgovor obavljen kad su preli granicu sa Albanijom ili kad su se smestili u izbegličkim logorima ili privatnim kućama; sa 11% je razgovarano u Makedoniji, a sa 3% u Crnoj Gori.[23] Od juna do decembra 1999. HRW je vodio razgovore na Kosovu; 60% razgovora HRW-a vo|eno je na Kosovu. Geografski regioni unutar Kosova izabrani su na osnovu izbegličkih izvetaja o masovnim krenjima ljudskih prava i izvetaja o masovnim krenjima koji su potekli iz drugih izvora. Ispitanici su birani na osnovu onoga to im je bilo poznato o konkretnim zloupotrebama unutar pokrajine. Razgovori su vođeni u optinama Dečani, Đakovica, Glogovac, Gnjilane, Istok, Kačanik, Kamenica, Klina, Kosovo Polje, Lipljan, Mitrovica, Orahovac, Peć, Podujevo, Pritina, Prizren, Orahovac, Suva Reka, Srbica i Vučitrn. Svi razgovori vođeni su tako da se dobiju otvoreni narativni iskazi o tome ta je ispitanik video. Nisu korićeni standardizovani anketni formulari (HRW 2001). Iako nisu korićeni standardizovani anketni formulari, razgovori su pretstavljali bogat izvor informacija o ubistvima. Kodirani su i uneseni u bazu podataka. Kodiranje za ovu studiju vrilo se nezavisno od originalne baze podataka HRW-a i prethodnog statističkog rada u HRW-u (2001). 2.4. Organizacija za evropsku bezbednost i saradnju (OEBS) Verifikaciona misija OEBS-a za Kosovo (OSCE Kosovo Verification Mission – VMK) prikupila je 1.837 razgovora u kojima se pominje jedno ili vie ubistava. Izjave su uzimane od marta do juna 1999. Razgovori su vođeni na vie od 90 pojedinačnih lokacija u Albaniji (37% razgovora) i na barem est lokacija u Makedoniji (61% razgovora). Obavljen je i manji broj razgovora (22) za koje mesto nije navedeno. Na samom Kosovu nisu prikupljene nikakve informacije. Lica koja su vodila razgovore iz OEBS-a/VMK-a otvorila su kancelarije na centralnim lokacijama blizu mesta okupljanja izbeglica (uglavnom logora), a ispitanici su dolazili da daju izjave. OEBS je informisao potencijalne ispitanike o projektu preko lokalnih nevladinih organizacija, oglasa u tampi i kontakata s lokalnim klinikama i bolnicama. Većina razgovora (preko 80%) obavljena je u izbegličkim logorima; ostali razgovori obavljeni su na javnim okupljalitima ili u privatnim kućama. OEBS/VMK je koristio standardizovane formulare za razgovore slične onima koje je koristio ABA/CEELI. Informacije su zatim unoene u bazu podataka, takođe sličnu onoj koju je koristila ABA. Za nau studiju, podaci su nezavisno zabeleeni kao to je bio slučaj i s HRW-om. Polustrukturirani razgovori OEBS-a preformatizovani su da bi bili kompatibilni sa formatom koji smo izradili za korićenje sa podacima ABA/CEELI. 3. Početno uređivanje podataka Iako su sve organizacije paljivo prikupljale skupove podataka, bio je potreban značajan napor da se podaci standardizuju na formate koji su nam omogućivali da utvrdimo u kojim zapisima su identifikovane iste rtve. Izvrena su dva kruga uređivanja podataka. U prvom krugu, pripremili smo podatke za sravnjivanje. U drugom krugu, dodatnim uređivanjem, podaci su pročićeni, sravnjivanje je finalizovano. U ovom odeljku opisuje se početno uređivanje podataka. U Odeljku 5 opisuje se konačno uređivanje podataka. Sva mesta koja su u razgovorima identifikovana kodirana su prema pojedinačnim geografskim lokacijama. Pre sravnjivanja, nekoliko geografskih sistema usaglaeno je s jedinstvenom kodnom emom. Kodna ema koristi listu imena mesta. Budući da mnogo mesta ima isto ime, lista mesta nije jedinstveno identifikovana imenima. Umesto toga, svakom pojedinom mestu dodeljen je kod. Kodovi su dodati geografskoj irini i duini mesta na koje se odnose. Započeli smo sa geografskom strukturom koja je opisana u Ball (2000) i ABA/AAAS (2000), koja koristi 29 optina. Ove strukture isputale su mnogo mesta koja su pomenuta u novim podacima prikupljenim za ovu studiju. Lista mesta dostupna preko “on-line” Informativnog centra humanitarne zajednice (Humanitarian Community Information Centre – HCIC) povezivala je imena mesta s koordinatama na mrei na detaljnom atlasu. Lista HCIC-a korićena je za standardizovanje imena mesta.[24] Sva su mesta kodirana prema geografskoj irini i duini. U prvoj fazi korićeni su Popis lokacija naseljenih mesta američke Nacionalne agencije za kartografske projekcije i izradu karata (National Imaging and Mapping Agency - NIMA).[25] Lista NIMA-e uključuje geografsku irinu i duinu, povezana je sa listom HCIC-a pomoću imena mesta. Ako su imena bila dvosmislena, ručno smo povezali kodove koristeći imena optina i proveravajući mesta na HCIC-ovoj karti i komercijalnoj karti.[26] Koristeći se listom i kartom HCIC-a, kao i komercijalnom kartom, izradili smo računarske rutine koje su potvrđivale geografsku irinu i duinu svakog mesnog koda u odnosu na mrene koordinate na karti HCIC-a. Lokacije koje se nisu poklapale sa svojom mrenom koordinatom bile su ručno ucrtane i ponovo proverene. Nekoliko gradova i sela imaju ista imena kao i optine. Nije uvek bilo moguće utvrditi navodi li se u nekom iskazu optina ili selo. Ponekad se takođe isto ime mesta javljalo u vie od jedne optine (npr. Drenovac je ime grada odnosno sela u četiri optine: Orahovcu, Dečanima, Pritini i Klini). Naposletku, bilo je slučajeva kad se mesno kodiranje nije moglo primeniti (npr. "u planinama"). Udaljenosti između lokacija računate su pomoću njihove geografske irine i duine.[27] Ove udaljenosti kori}ene su da bi se utvrdilo da li se protivrečni iskazi svedoka o nekoj lokaciji verovatno odnose na isto mesto. Lokacije koje su međusobno udaljene manje od 10 km rutinski su tretirane kao ista lokacija.[28] 3.2. Uređivanje podataka o imenu i polu Konsultovali smo doma}e Albance i nekoliko indeksa albanskih imena dostupnih preko interneta kako bismo interpretirali imena navedena u izvorima podataka. Ispravljene su česte pogreke u pisanju imena i prezimena. Pre ili za vreme sravnjivanja podataka identifikovani su i ispravljeni slučajevi obrtanja imena i prezimena. Neka su imena zapisana fonetski budući da su ih zabeleili pojedinci koji nisu umeli da govore albanski dok su kod drugih postojale očigledne greke pri unosu podataka. Pol je direktno navodio ispitanik ili je kodiran na osnovu imena (ako je ime bilo navedeno). Imena su unakrsno proveravana da bi bili sigurni da je isto ime uvek dodeljeno istom polu.[29] Izvrena je potraga za rtvama Srba koje je bilo moguće utvrditi. Neki slučajevi bili su očiti, npr. odrednica "srpski komandant". Ostali su identifikovani putem provere prema listi uobičajenih srpskih imena i prezimena.[30] Ukupan broj od 30 Srba, identifikovanih prema listama imena, isputen je iz procena.[31] 3.3. Formatiranje datuma smrti Izvreno je uređivanje podataka kako bi se ispravile zabune izazvane razlikama u redosledu prema kojem se dani i meseci konvencionalno zapisuju u Evropi (dan, mesec) i Americi (mesec, dan). U drugim zapisima zabeleene su netačne godine smrti (npr. 1990. i 2999; obe su ispravljene na 1999.). Posle uređivanja, svi su datumi standardizovani na ISO format GGGG-MM-DD, gde je G godina, M mesec, a D dan. Iako su nazvani "datumom smrti", izvetaji o razgovorima obično su sadr`avali meavinu stvarno zapamćenih datuma incidenata i datuma kad su tela viđena. Stoga je moguće da je navedeni datum docniji od stvarnog datuma smrti. Kad su originalni razgovori uneti u bazu podataka, preciznost informacije o datumu kodirana je kao "tačna", "piblina", "nepecizna" ili "nepoznata". Kodiranje preciznosti grubo odgovara stepenu preciznosti definisanom prema danu, nedelji ili mesecu događaja, odnosno odsutsvu te preciznosti. Kao rezultat sravnjivanja zapisa s drugim zapisima, ponekad su za svaki zapis postojali viestruki datumi. Kodiranje preciznosti je korićeno za izbor "najboljeg" datuma, kako je opisano u pododeljku 5.2.[32] 4. Početno sravnjivanje podataka Naa radna hipoteza bila je da svaki sistem podataka (osim ekshumacionih podataka) moe sadr`ati mnoge dvostruke izvetaje o smrti iste rtve. Naravno, trebalo je da se ti duplikati pronađu pre vrenja bilo kakve analize. Problem dvostrukih zapisa podeljen je na četiri podzadatka: intra- i intersistemsko sravnjivanje za pojedince, te intra- i intersistemsko sravnjivanje za grupe. Svaki pojedinačni zapis koji je mogao da se identifikuje najprije je poređen sa ostalim pojedinačnim zapisima koji su mogli da se identifikuju u njegovom izvornom skupu podataka. Ovaj se proces naziva "intrasistemsko sravnjivanje" ili “samosravnjivanje” jer se njime jedan izvor podataka sravnjuje sa samim sobom.[33] Nakon to su svi pojedinačni zapisi nekog izvora podataka sravnjeni sa samim sobom, izvetaji iz svakog izvora sravnjivani su sa onima iz drugih izvora. Taj smo proces nazvali “intersistemsko sravnjivanje”. Imenovani pojedinci u svakom sistemu poređeni su s imenovanim pojedincima u svim drugim sistemima, a podudarnosti su beleene. Primarne promenljive veličine za proveru duplikata bile su imena (ime, prezime) i geografska lokacija. Ostale informacije, kao to je datum smrti, starost ili pol, bile su takođe razmatrane da bi se potvrdili ili odbacili potencijalno podudarni podaci. Isti proces intra- i intersistemskog sravnjivanja ponovljen je i kod podataka o anonimnim grupama. Lokacija i vreme bile su dve ključne promenljive veličine korićene za objedinjavanje eventualnih dvostrukih izvetaja o anonimnim ubistvima. U principu, izvetaji o anonimnim smrtnim slučajevima mogli su se odnositi na pojedince koji su u drugim izvetajima identifikovani imenom. Pronali smo nekoliko načina za kombinovanje pojedinačnih i grupnih podataka kako je nie opisano. Pristupi koje smo razmatrali daju uverljiv skup donjih granica ukupnog broja ubistava, kako je opisano u Odeljku 6. U Dodatku 2 opisuju se pristupi modelovanja kojima se unapre|uju ove donje granice. Iako je proces sravnjivanja bio računarski potpomognut, odluke su donosili ljudi. Sravnjivanje je vrio mali tim paljivo obučenih kodifikatora koje je nadzirao jedan od autora. Tokom drugog kruga sravnjivanja koji je opisan u Odeljku 5, preduzeti su drugi koraci za merenje kvaliteta sravnjivanja. 4.1. Promenljive veličine korićene za intrasistemsko sravnjivanje pojedinačnih zapisa Ključni elementi za identifikovanje dvostrukih izvetaja o istim licima bila su imena i prezimena. Bilo je mnogo uobičajenih greaka u pisanju (ili krivih transkripata) nekih imena, uključujući sledeće: Hysen, Hyseni, Iseni; Ymeraj, Imeraj; Krasniqi, Krasnici, Krasniki; Kuci, Kuki, Quki, Quci; Cake, Caka, Cakaj; te Loki, Loku. Uopteno je "H" kao prvo slovo često isputeno u transkriptima intervjua. Prezimena koja počinju određenim slovom često su se javljala u različitim kombinacijama: K je moglo da bude C ili Q; često su brkani Y i I; Xh je moglo da bude Gj ili Sh. Sve su ove kombinacije rutinski upoređivane. Uz rutinska pravila, traene su manje uobičajene ali očite greke u vezi sa sličnim slovima u sredini imena. Tokom vremena, kodifikatori su se upoznali sa raznim načinima pisanja različitih imena. Kada su zapisi sadravali slična imena, vođeni su kao podudarni osim ako se nisu jasno razlikovali prema nekoj drugoj informaciji. Informacije koje su pobijale pretpostavku da su dva zapisa podudarna uključivale su starost i pol rtava, kao i datum i mesto smrti. Podaci o starosnoj dobi retko su bili od koristi, jer su često bili priblini. Međutim, ako je bila reč o razlici od 20 ili vie godina, pretpostavili smo da su zapisi različiti; teorija je bila da su dve rtve istog imena a različite starosti verovatno bile rođaci. Podaci o polu retko su se razlikovali, osim ako su se razlikovala i imena, budući da su u ranijim fazama uređivanja podataka imena korićena za razlikovanje polova. Mesto smrti pretstavljalo je najvaniju dodatnu informaciju za procenu podudarnosti zapisa. Zapisi kod kojih su se imena podudarala a starosna dob razlikovala za manje od 20 godina smatrani su istovetnima ako su mesta bila ista. Posebno, ako su mesta bila u istoj optini ili susednim optinama, smatrana su istovetnim. 4.2. Osnovni pristup intrasistemskom sravnjivanju pojedinačnih zapisa Literatura o povezivanju arhivskih zapisa nudi mnogo pristupa sravnjivanju lica na listama.[34] Međutim, kompleksnost ovde opisanih podataka, zahtevala je da se koristimo manuelnim metodama. Dok smo se informisali i uređivali podatke, uspeli smo da u ve}oj meri automatizujemo ovaj proces. Usled ograničenja u resursima, nismo mogli da odredimo kvantitet svih greaka u procesu sravnjivanja kao to je učinjeno u Belin i Rubin (1995). Umesto toga, oslanjali smo se na ponavljanje računarski potpomognutog sravnjivanja pri kojem je u poslednjim etapama pronađeno veoma malo podudarnosti. Kako bismo minimalizovali dejstvo preostalih greaka u sravnjivanju, u svim nejasnim slučajevima zapise smo pre smatrali podudarnim, to znači da su procene bile manje. Unutar svakog skupa podataka, zapisi su sravnjivani tako da je papirna lista tampana u obliku tablice. Liste su razvrstane prema nekoliko promenljivih veličina: prema mestu, u sledećoj etapi najpre prema prezimenu pa imenu, a u narednoj najpre prema imenu pa zatim prezimenu.[35] Iako je moguće da se podudrani zapisi pojave na udaljenim poloajima u jednom tipu razvrstavanja, oni }e se pojaviti jedan blizu drugog barem u jednom tipu razvrstavanja. Na primer, dva zapisa sa istovetnim imenima i prezimenima pojaviće se zajedno pri razvrstavanju i prema imenu i prema prezimenu. Dva zapisa sa različito napisanim prezimenima, ali istim imenima, pojaviće se zajedno pri razvrstavanju prema imenu. Kad se pronađu zajedno, prezimena mogu odmah da se identifikuju. Korićenjem tehnike viestrukog razvrstavanja (ili svrstavanja u blokove), kodifikatori su identifikovali blokove istovetnih zapisa. Odabran je zapis sa najboljim podacima (odnosno na kojem je ime najbolje zapisano, a vreme i mesto bili najprecizniji). Svi brojevi zapisa grupisani su u "krug" i sačuvani za kasniju analizu najverovatnijeg datuma (kao to je opisano u Odeljku 5) za konačan zapis.[36] Taj zapis nazvan je "ključnim" zapisom.[37] Tehnika se menjala kako su kodifikatori sticali sigurnost. U prvom delu tri kodifikatora su nezavisno sravnjivala sve podatke HRW-a sami sa sobom i deo podataka ABA-e koji su se sastojali od razgovora obavljenih na Kosovu. Nakon to je zavren proces samosravnjivanja za zapise HRW-a i ABA-e, pristup se pokazao dovoljno rutinski, pa je jedan kodifikator mogao da postigne gotovo jednako pouzdane rezultate kao i dvojica ili trojica. Stoga je samo jedan kodifikator samosravnjivao podatke OEBS-a i drugi deo podataka ABA-e. Iako je proces bio rutinski, rezultati sravnjivanja bili su kompleksni jer su podrazumevali saimanje jednog neodređenog i nepredvidivog broja zapisa u jedan "ključni" zapis. Iako greke nisu uvek bile očigledne, unutranja konsistentnost saetih zapisa mogla je da se proceni (vidi nie). Kod intrasistemskog sravnjivanja HRW-a i ABA-e, uočene su pojedinačne rtve koje su dva kodifikatora različito klasifikovala. Kodifikatori su razmotrili razlike i zajedno izradili konsenzusnu listu podudarnosti.[38] Saglasnost među kodifikatorima kretala se od 75% do 90%. Sve razlike pregledao je i razreio jedan od autora studije. Za sve intrasistemske podudarnosti, struktura odluke u procesu sravnjivanja procenjena je prema uverljivosti. Naročito je, za svaki sistem, procenjivan svaki krug koji je sadravao dva ili vie zapisa poređenjem ključnih polja podudarnosti kako bi se postigla saglasnost. Kod svakog izvora i za svaki krug koji je sadravao vie od jednog zapisa, svi zapisi su poređeni sa ključnim zapisom. Za svako od tri polja (prezime, datum, mesto), izbrojano je koliko je zapisa u saglasnosti sa ključnim zapisom. Prezimena: Udeo zapisa unutar krugova koji su bili međusobno podudarni s obzirom na prvih tri ili sedam znakova unesen je u tabelu. Ovo poređenje je vreno samo za zapise sa imenima koja su imala najmanje tri ili sedam znakova. Podudarnosti prezimena bile su veoma bliske: kada se uzmu u obzir tri skupa podataka, između 85% i 95% sravnjenih zapisa imalo je zajednička najmanje prva tri slova. Zapisi čija se prva tri slova ne podudaraju ne moraju se nuno smatrati različitim. Indeksom sličnosti imena mo`e se meriti način pisanja ili varijacije u transkripciji kod izvornih zapisivača. Mi tumačimo visok stepen saglasnosti kao indikaciju da su imena najčeće identifikovana kao podudarna sa drugim, sličnim imenima. Datumi: Takođe je razmotrena vremenska blizina intrasistemskih podudarnih zapisa. Kod procesa samosravnjivanja, između 79% i 84% preciznih datuma u podudarnim zapisima bilo je u razmaku od jedne nedelje. Datumi koji su kodirani kao priblini nisu pore|ani. Lokacije: Uz primenu preciznih kodova za lokacije, za pojedince u intrasistemskim podudarnim zapisima bili su navedeni identični kodovi u 66% (OEBS) da 99% (HRW) slučajeva; kada je poređenje lokacija proireno na mesta međusobno udaljena do 25 km, kod dodatnih 28% sravnjenih zapisa OEBS-a utvrđena je podudranost za mesni kod, čime je stepen podudarnosti mesta porastao na 94%. Slična imena, datumi i mesta koja se tačno ne podudaraju mogu da odraavaju razlike u sećanju svedoka, odnosno ne pretstavljaju nuno greke u kodiranju. Međutim, visok stepen slaganja u ovim merama ukazuje na to da su zapisi sa sličnim imenima, kao i datumima i mestima, pravilno identifikovani kao podudarni ako su vremenski ili prostorno bliski. Zapisi sa različitim podacima ređe su identifikovani kao podudarni. Nai rezultati posle ovog početnog intrasistemskog sravnjivanja imena pojedinaca smanjili su broj zapisa koji su prosleđeni u sledeće etape za otprilike jednu trećinu. Pronađeni duplikati omogućili su nam da poboljamo izvetaje o datumima i da naučimo vie o varijacijama albanskih imena. Iako u ovoj etapi nisu pronađeni svi duplikati, ona je dala osnovu na kojoj su započeto intersistemsko poređenje opisano u pododeljku 4.3. Kao to ćemo razmotriti u Odeljku 5, docniji koraci u procesu omogućili su otkrivanje većine preostalih duplikata. Međutim, postojao je mo`da mali broj "preterivanja u podudarnostima", koja nisu mogla da budu otkrivena u docnijim koracima pa stoga mogu da pretstavljaju razlog za zabrinutost. "Preterana podudarnost" moe se javiti kada se pri samosravnjivanju poveu zapisi o dva različita lica. Nema načina da se docnije u postupku isprave takve greke, jer zapis o jednom od lica vie nije raspolo`iv. Preterana podudarnost ima tendenciju da smanjuje broj ubistava te stoga dovodi do potcenjivanja ukupnog broja rtava.[39] 4.3. Intersistemsko sravnjivanje pojedinačnih zapisa Intersistemsko sravnjivanje sastojalo se od poređenja svakog pojedinog zapisa u jednom izvoru podataka ("izvor") sa svim mogućnim podudarnim podacima u drugom izvoru podataka ("cilj"). Kao i kod intrasistemskog sravnjivanja, sav je posao obavljen manuelno. Mogući zapisi u ciljnoj bazi podataka uključivali su sve pojedince čija su imena počinjala na isto slovo (ili jedno od slova koja se slično izgovaraju, kako je gore opisano). Tablični kalkulatori koji su korićeni kod samosravnjivanja zamenjeni su specijalizovanim softverom koji je napravljen sa namerom da olaka proces odlučivanja pri sravnjivanju.[40] Svaki izvorni skup podataka podeljen je na podskupove. Svaki podskup (nazvan "reanj") bio je proporcionalno stratifikovan (prema datumu smrti i regionu) slučajni uzorak celine. Renjevi su izrađeni tako da priblino pretstavljaju posao obavljen za pola dana. Kada bi par kodifikatora zavrio isti reanj, nadleni istraivač bi poredio rezultate i proveravao sva neslaganja sa oba kodifikatora. Na taj način, objedinjeni su različiti stilovi kodiranja, a suptilne razlike u kodifikatorskom radu su uočene i uklonjene. Kodifikatori su dobijali jedan ili vie probnih renjeva za obuku, a njihov rad nije prihvatan dok ne bi postigli barem 90% rezultata saglasnih sa standardnim odgovorima za probne renjeve. Identifikovani su kodifikatori čiji je rad imao nizak stepen slaganja sa probnim renjevima i oni su proli dodatnu obuku. Jedinstveni "ključni" zapisi koji su preostali nakon procesa samosravnjivanja pretstavljali su ulazne podatke za intersistemsko sravnjivanje. Poređenje podudarnosti vreno je prema istim pravilima koja su navedena i u pododeljku 4.1. Svaki zapis u svakom izvoru pore|en je sa svakim zapisom u ostala tri izvora. Poređenja nisu bila simetrična. To znači, ako je izvor A poređen sa izvorom B, izvor B nije poređen sa izvorom A (iako su povremeno vrena simetrična poređenja za dodatnu redundaciju). Budući da su barem dva (a često i vie) kodifikatora donosila odluke o podudarnosti za svako poređenje, bilo je preko dvostruko vie odluka nego mogućh poređenja. Ukupno su donesene 18.462 odluke o podudarnostima, a grubi udeo ukupne saglasnosti po ovim odlukama iznosio je 94%. Iako je stepen slaganja između kodifikatora bio prilično visok, bilo je i neslaganja. Jedan od autora ove studije razmotrio je sve slučajeve neslaganja i doneo konačnu odluku. Kao to je prethodno pomenuto, razgovori koje je ABA obavila izvan Kosova obrađivani su drugačije nego drugi izvori. Dok su postupci samosravnjivanja ovog dela podataka bili istovetni onima koji su opisani u pododeljku 4.2, intersistemsko sravnjivanje je vreno nakon to su ostali sistemi sravnjeni i objedinjeni. No, u ostalim elementima, postupci su bili jedanki. Dva različita kodifikatora nezavisno su sprovodila postupak sravnjivanja, a njihove su odluke poređene. Udeo slaganja među kodifikatorima za ovu opciju bio je relativno nii (priblino 80%). Međutim, kao i kod drugih sravnjenih zapisa, sva neslaganja su razmotrena i razreena. Pri početnom intrasistemskom sravnjivanju podataka primećena su izvesna područja u podacima koja su zahtevala dodatnu proveru, posebno kod ekshumacionih podataka, ali i na drugim mestima. Zanimljivo je da je, kao i kod etape samosravnjivanja, broj smrtnih slučajeva opet smanjen otprilike za trećinu. U Odeljku 5, opisaćemo kako smo svoja saznanja iskoristili za donoenje konačnih odluka o podudarnosti pojedinačnih smrtnih slučajeva. 4.4. Intra- i intersistemska obrada anonimnih grupnih zapisa Pri dosad opisanom sravnjivanju poređene su pojedinačne rtve koje su identifikovane po imenu sa drugim takvim rtvama. Međutim, izvori opisuju priblino sedam puta vie rtava u anonimnim grupama nego pojedinačnih imenovanih rtava. Po svojoj prirodi, izvetaji o anonimnim grupama sadre manje informacija pomoću kojih se moe utvrditi da li su izvetaji o grupama međusobno jedinstveno podudarni. Nakon opsene analize, zaključili smo da je nemoguće sravniti podatke o pojedincima sa podacima o grupama unutar sistema podataka ili sravniti grupe sa drugim grupama između različitih sistema podataka uz dovoljnu pouzdanost da bi se modelirale informacije koje nedostaju kako je opisano u Dodatku 2. Ipak, sravnjivanje grupa sa drugim grupama i pojedincima donosi nekoliko prednosti. Kao prvo, sravnjivanje bilo kakvih zapisa obezbe|uje dodatne informacije o preciznosti (ili eventualnoj nepreciznosti) podataka o datumu i mestu. Ako je najverovatniji parnjak za neki zapis (na osnovu kvalitativnih informacija u poljima za beleke, ili ako se mesta podudaraju, a datumi razlikuju) drugi zapis koji je vremenski ili prostorno udaljen, to implicira da jedan od ta dva zapisa sadr`i neprecizan podatak o datumu ili mestu. Kao drugo, sravnjivanjem podataka o grupama i pojedincima unutar sistema, moguće je proceniti osnovnu donju granicu broja ubijenih koji nedostaju na listi identifikovanih. Proces sravnjivanja za grupe sproveden je na sledeći način. Kao prvo, sravnili smo izvetaje o grupama same sa sobom u svakom izvoru podataka. Anonimne grupe spojene su po određenim mestima i datumima. To znači da su grupe ljudi za koje je utvrđeno da su ubijeni na nekoj konkretnoj lokaciji unutar priblino 10 dana smatrane duplikatima; iri datumski raspon uvrten je ako su dalji datumi bili neprecizni ili ako su narativne informacije iz intervjua ukazivale na to da se radi o istom incidentu. Na gotovo svim seoskim lokacijama bilo je vrlo malo grupa i one su bile okupljene oko određenih datuma. Nakon to su izvrena sravnjivanja za grupe, procenjene su sve grupe sa vie od jednog podudarnog zapisa. Samo 15 njih imalo je datume koji su bili udaljeni vie od 14 dana. "Najbolji" datum odabran je prema istoj logici kao i kod pojedinaca sravnjivanih unutar istog sistema. Drugo, u svakom sistemu podataka podaci o pojedincima sravnjeni su sa podacima o grupama. Sravnjivanje je vreno prvenstveno prema lokaciji i datumu, iako su u mnogim slučajevima dodatne informacije o grupi pomogle pri sravnjivanju. Neki inače neidentifikovani zapisi obeleeni su kao "brat rtve 27" ili je grupa identifikovana kao "porodica X". Sravnjivanje podataka o pojedincima i grupama je u nekim slučajevima povećalo količinu informacija o pojedinačnim ubistvima. Na primer, ako izvetaj o nekom pojedinačnom ubistvu nije nosio specifičan datum kada se ubistvo dogodilo, anonimni izvetaj (o grupi) mogao je da pru`i tu informaciju. Čak i ako je pojedinačni izvetaj sadrao podatak o datumu, grupni izvetaj je korićen kao potvrda originala.[41] Treće, podaci o pojedincima sravnjivani su sa grupnim podacima u drugim izvorima podataka. Taj je proces imao iste prednosti to se tiče potvrde informacija kao to je gore opisano. ^etvrto, brojnosti po grupama pretstavlja metodu za ispitivanje broja smrtnih slučajeva koji nisu prijavljeni u sklopu pojedinačnih zapisa. Pomoću brojnosti jedinstvenih grupa moemo da procenimo da li je obrazac ubistava koja nisu prijavljena kao pojedinačna ravnomerno distribuiran po prostoru i vremenu ili to nije slučaj. Ovo pitanje detaljnije je razrađeno u Dodatku 2. 4.5. Objedinjavanje podataka o anonimnim grupnim ubistvima između sistema Žrtava koje su prijavljene tokom razgovora kao članovi anonimnih grupa bilo je priblino pet puta vie nego imenovanih rtava. [42] U ovom odeljku opisa}emo kako smo se ovim informacijama koristili da bismo istraili broj rtava koje nisu identifikovane po imenu. Nakon samosravnjivanja grupa, utvrdili smo da je postojao velik stepen ponavljanja u grupnim podacima: faktor ukupne redukcije prijavljenih podataka na neduplikovane podatke iznosio je vie od pet. Neduplikovani zapisi o grupama nastali kao rezultat sravnjivanja sastojali su se od jednog ili vie zapisa o grupama. Tako je svaki zapis sadrao distribuciju veličine grupa koja je mogla da se iskoristi za procenu "najbolje" veličine te grupe. Za svaku grupu procenjivane su tri veličine. Za procenu minimalne veličine, uzeli smo najmanju prijavljenu veličinu grupe koja je bila veća od broja pojedinaca koji je sravnjivan sa tom grupom (unutar tog sistema podataka). Medijanska veličina bila je medijan svih veličina većih od broja pojedinaca koji je sravnjivan sa grupom. Maksimalna veličina bila je najveća navedena veličina bilo koje grupe u krugu. Sume po grupnim zapisima prema vremenu i prostoru u svakom sistemu podataka nisu duplikovane. Međutim, brojnosti po grupama ne mogu direktno da se sabiraju između sistema podataka jer podaci o grupama nisu bili sravnjeni između sistema. Uklonili smo duplikate iz brojnosti po grupama upoređujući sumu brojnosti po grupama (pomoću minimalnih, medijanskih i maksimalnih brojnosti) u tri sistema. Na svakoj tački smo izabrali maksimum triju sistema, pri čemu smo pretpostavili da su druga dva sistema potpuno sravnjena sa najvećim. To je najkonzervativnije pravilo za objedinjavanje koje se moe upotrebiti. Tako dobijeni podaci pretstavljaju procenu ukupnog broja anonimnih ubistava u vremenu u prostoru, te se koriste za ocenu potpunosti jedinstvenih pojedinačnih zapisa (vidi Odeljak 6.3). 5. Pročićavanje postupka uređivanja i sravnjivanja Kad su sve odluke u vezi sa početnim intra- i intersistemskim sravnjivanjem i uređivanjem primenjene na sirove podatke, kombinovani skup podataka mogao se revidirati, uz korićenje informacija prikupljenih tokom prethodnih etapa. Revizija se skoncentrisala na nedoslednosti u sravnjivanju, na biranje najbolje promenljive veličine koja će da pretstavlja ceo skup sravnjenih zapisa, imputovanje nedostajućih datuma, ponovnu procenu ekshumacionih podataka i na opte popravljanje nedoslednosti u zapisivanju, te na druge greke pronađene u naem početnom radu. 5.1. Nedoslednosti u sravnjivanju Zbog načina na koji smo sravnjivali ciljeve sa izvorima u početnom procesu sravnjivanja, moguće je da su zapisi u različitim skupovima podataka sravnjivani prema nedoslednim obrascima. Na primer, razmotrimo tri odluke o sravnjivanju parova: A1à B1, C1à A1 i B1àC2. U ovom primeru, zapis A1 (iz skupa podataka A) bio je poređen sa skupom podataka B i sravnjen sa zapisom B1. U zasebnom postupku, zapis C1 poređen je sa skupom podataka A i sravnjen sa zapisom A1. U trećem sravnjivanju, zapis B1 poređen je sa skupom podataka C i sravnjen sa zapisom C2. Nakon objedinjavanja, čini se da se zapisi A1 i B1 podudaraju i sa C1 i C2. Ako je skup podataka C ispravno samosravnjen, radi se o kontradikciji. Ukupno, bilo je 298 zapisa poput C1 i C2. Reenje je bilo očigledno: u svakom paru pogreno sparenih zapisa, trebalo je da se obrazac sravnjivanja za jedan od zapisa modifikuje. Sve ove kontradikcije bile su revidirane i razreene. Postoje dva načina za njihovo razreavanje: jedna mogućnost je da je C1 i C2 trebalo da budu identifikovani kao podudarni u toku intrasistemskog sravnjivanja. U tom slučaju, jedan od dva zapisa moe prosto da se ispusti iz analize.[43] Tako je reeno osamdeset zapisa. Druga mogućnost je da je identifikovana podudarnost u slučaju C1 ili C2 pogrena pa zapisi treba da budu razdvojeni; preostalih 218 pogreno sparenih zapisa bilo je razreeno razdvajanjem. U nekim slučajevima, ako su zapisi pogreno spareni, mogla je postojati prava podudranost koja je zasenjena pogrenom. Takve potencijalno proputene podudarnosti traene su pri zavrnom uređivanju (vidi Odeljak 5.4.). Svaki zapis u konačnom skupu podataka pretstavljao je kombinaciju svih zapisa koji su sa njim bili podudarni. Takav kombinovan zapis potencijalno je sadravao mnogo datuma. Izbor "najboljeg datuma" vrio se na sledeći način. Prvo smo agregovali podudarne zapise prema datumu. Po pravilu je u skupu podudarnih zapisa jedan datum uobičajeniji od drugih. Ako je bilo moguće, najpre smo odabrali taj datum. Među preostalim datumima, izabrali smo datum sa najviim stepenom preciznosti (koji je definisan prema najpreciznijem zapisu u tom krugu). Ako je postojalo vie od jednog datuma sa tim stepenom preciznosti, izabrali smo datum sa najvećim brojem sastavnih zapisa u tom krugu. U slučajevim gde su postojale veze (datumi sa istom preciznoću i brojem sastavnih zapisa), izabrali smo raniji datum. Argumenat za takvu odluku jeste da su docniji datumi verovatno bili posledica toga to su ljudi videli tela nakon to je ubistvo izvreno, a ne samo ubistvo. Kod 204 zapisa bez informacija o datumu, primenjena je tzv. “hot deck” procedura za dodeljivanje slučajnog datuma iz "donatorskog" zapisa koji je geografski najblii lokaciji zapisa kojem nedostaje datum.[44] Od potencijalnih donatora nasumično su odabrana tri datuma, te su napravljene kopije originalnog zapisa za svaki od uzorkovanih datuma. Svakom novom zapisu dodeljena je teina od 0,33.[45] Neki od datuma imputovanih “hot-deck” procedurom bili su izvan datumskog raspona interesa za ovu studiju (od 20. marta do 22. juna). Ti zapisi (i njihove parcijalne teine) bili su stoga isključeni iz analize. Osetljivost procena na "najbolji" izbor datuma i imputovanje analizirani su u Dodatku 2. Kao to pokazuje Dodatak 2, glavni statistički rezultati robusni su prema nesigurnostima izazvanim nedoslednostima u datumima ili time to je u malom broju slučajeva bilo izvreno imputovanje podataka. U početnim koracima uređivanja i sparivanja opisanim u Odeljcima 2-4, pretpostavili smo da su ekshumacioni podaci po definiciji jedinstveni. To znači da smo pretpostavili da nije bilo slučajeva da su različiti posmrtni ostaci bili identifikovani kao ista rtva. U ovoj fazi smo kritički preispitali tu pretpostavku. Sravnjeni su zapisi sa istovetnim imenima kod kojih je kao mesto smrti navedeno isto selo, a starosna dob bila ista (ili nije bila navedena). Međutim, čak i ako su imena bila istovetna, ali su zabele`ene starosne dobi bile različite, zapisi nisu spajani. Ukupno, 232 ekshumaciona zapisa koji su sadrali imena spareni su na ovaj način. To je rezultiralo neto smanjenjem ukupnog broja pojedinačnih ekshumacionih zapisa sa imenima za ovaj broj. Broj anonimnih rtava povećali smo za isti iznos, zaključujući da su ekhumacioni izvetaji dokumentovali dva tela, ali da su za ta tela sprovedeni drugi oblici indirektne identifikacije, to je dovelo do dvostrukog registrovanja istog lica. 5.4. Ostala uređivanja konačno utvrđenih podudarnosti Kad je prikupljen ceo skup podataka, jedan od autora pregledao ga je pet dana. Pri tome je pronaao 329 modifikacije pri sparivanju, kao i 400 ispravaka imena, datuma i mesta. Proces je bio jednostavan: lista se sortira prema ključnom polju (prezime, ime ili mesto) i zatim se skeniranjem trae ponavljanja.[46] Navedenih 400 ispravaka prvenstveno se odnosilo na ispravljanje različitih varijanti zapisivanja imena. Na primer, prezime jedne rtve bilo je "Pashi", to je očigledno pogreno napisano "Gashi". Posebna panja je poklonjena imenima i prezimenima koja su se pojavila samo jednom, jer se pretpostavljalo da bi se moglo raditi o grekama u pisanju. U ovoj etapi međusobno su usklađeni imena, datumi i mesta koji su bili očigledno nedosledno vođeni u različitim sistemima podataka. Na primer, bilo je slučajeva kod kojih je cela porodica identifikovana na jednoj lokaciji u ekhumacionim podacima, ali je u drugom izvoru postojao izvetaj koji ih je smetao u neku drugu optinu. Proveravajući lokacije, zaključili smo da to nije bio prost slučaj pogrenog kodiranja. Verujemo da se radi o slučajevima gde su tela pokopana na lokacijama daleko od mesta ubistva. Jedan od najizrazitijih primera ove vrste odnosi se na tela sedmoro članova jedne porodice koji su ekhumirani u Donjoj Šipanici. ABA/CEELI projekat dobio je izvetaj da je njih petoro ubijeno u 70 km udaljenoj Suici. Preostala dva člana porodice nisu identifikovana ni u jednom od skupova podataka koji su se bazirali na razgovorima. Svih sedam ljudi pripisano je Suici. Kada su zapisi zasnovani na ekshumacijama protivrečili zapisima iz ostalih skupova podataka, lokacija navedena u razgovoru kori}ena je pre nego lokacija ekshumacije. Neke druge provere bile su kompleksnije. Na primer, otkrili smo dodatne podudarne zapise koji su promakli jer su kodirani na međusobno udaljene lokacije. Kodifikatori nisu u početku sparili zapise budući da je merenje udaljenosti pokazivalo da su mesta smrti međusobno veoma udaljena. Kad smo revidirali listu, otkrili smo da su sela bila u različitim optinama ali da su nosila isto ime. Na primer, brkana su sela Pogra|e (u optini Gnjilane) i Pogra|e (u optini Klina) te su različiti izvetaji o istoj rtvi kodirani za dve lokacije. Kodifikatori su odbacili mogućnost podudarnosti jer su ta dva sela međusobno udaljena 83 km. Nali smo pet slučajeva takvog tipa. Neki su zapisi zahtevali značajnije modifikacije. Kad su zavrene ispravke imena, pronali smo 153 zapisa koji su trebali biti spareni tokom samosravnjivanja. Konačno, 176 novih podudarnosti pronađeno je posle uređivanja. Svaki od ovih zapisa objedinjen je sa svojim novim parnjacima, čime se povećao broj izvora u kojima su nađeni. Iako je moguće da jo uvek ima neotkrivenih dvostrukih zapisa, verujemo da ih je veoma malo. Kad smo zavrili konačni pregled, proverili smo koliko su nam puta promakli podudarni zapisi koje je trebalo da pronađemo uz pomoć naih pravila za početno sravnjivanje. Otkrili smo 97 novih podudarnih zapisa koji su teoretski mogli da budu pronađeni pomoću izvornih pravila za sravnjivanje. To pretstavlja stopu greke u naem početnom procesu koja iznosi manje od 2%. Tako nizak stepen greke jeste razlog zbog kojeg verujemo da su, nakon zavrne etape sravnjivanja opisane u ovom Odeljku, eventualne preostale greke zanemarljive. 6. Konačni saetak rezultata podataka Da bismo saeli rezultate koraka za obradu podataka, pogledaćemo rezultate postignute po izvorima za pojedinačne zapise. Drugo, ispitaćemo rezultate dobijene povezivanjem različitih izvora, ponovo za pojedinačna ubistva. Treće, ispitaćemo načine kombinovanja podataka o anonimnim ubistvima sa podacima o pojedinačnim smrtnim slučajevima. 6.1. Obrada podataka prema izvoru za pojedinačne zapise Ranije smo na Slici 1 naveli brojnosti ulaznih podataka koje smo dobili iz svakog izvora. Sada moemo sumarno da prikaemo broj ubistava imenovanih pojedinaca koje smo dobili kao rezultat nakon početnog i zavrnog intrasistemskog sravnjivanja. Ovi rezultati su prikazani na Slici 3. Izvori koji su se zasnivali na razgovorima smanjeni su za 29%-51%, dok su ekshumacioni podaci smanjeni za 11%. Ono to nije prikazano na Slici 3 jeste stepen do kojeg je proces sravnjivanja i uređivanja poboljao kvalitet informacija u svim izvorima podataka putem nadopunjavanja informacija između podudarnih zapisa. 6.2. Obrada podataka među izvorima za imenovane, pojedinačne zapise Drugi način na koji moemo saeti rezultate nae obrade podataka jeste da pogledamo ukupan broj pojedinačnih smrtnih slučajeva iz svih izvora, nakon eliminisanja dvostrukog računanja. Broj jedinstvenih pojedinačnih zapisa pronađenih u svakoj kombinaciji podudarnosti prikazan je na Slici 4. On uključuje samo zapise koji su imali valjanu informaciju o datumu, u rasponu od 20. marta do 22. juna. Žrtve koje su ubijene pre 20. marta i posle 22. juna nisu uključene. Tabela ukazuje na to da je od ukupnog broja od 4.400 rtava relativno malo rtava dokumentovano u tri ili četiri projekta, kao to pokazuju ćelije levo gore. Na primer, samo 27 rtava dokumentovano je u sva četiri izvora podataka. Ova ćelija nalazi se levo gore na tabeli, na preseku "da-da" reda i "da-da" stupca. Ako se pomaknemo nie i nadesno, ćelije pokazuju vrednosti za progresivno manje frekventno dokumentovane rtve. Na primer, 1.131 rtva dokumentovana je samo u ekshumacionim podacima.[47] Slika 4 ne uključuje procenu za "ne-ne-ne-ne" ćeliju (koja je označena kao "nije primenjivo"), odnosno, broj ljudi koji nisu individualno dokumentovani ni u jednom od četiri projekta.
Slika 3. Pojedinačne brojnosti iz osnovnih izvora, bruto ukupan iznos i neto neduplikovane brojnosti
Slika 4. Broj pojedinačnih rtava ubistava, prema dokumentacionom statusu (uključujući i rtve sa imputovanim datumom smrti)
6.3. Procena potpunosti pojedinačnih podataka Pojedinačne rtve zacelo su potcenjene. "Ne-ne-ne-ne" ćelija na Slici 4 ne moe da bude prazna. Nekoliko je mogućnih metoda kojima se moe proceniti broj ubistava koja nisu pojedinačno identifikovana. Podaci o anonimnim grupama pruaju prvu indikaciju da postoji značajan broj rtava koje nisu dokumentovane među imenovanim pojedincima. Grupna procena poređena je sa pojedinačnom procenom za svaku vremensku ili prostornu tačku, kako je opisano u pododeljku 4.5. I ovde smo, dreći se najkonzervativnijeg pravila za objedinjavanje, zbir pojedinaca na svakoj vremensko-prostornoj tački oduzeli od grupnog zbira na toj tački. Time se pretpostavlja da je svaki dokumentovani pojedinac takođe dokumentovan i kao član anonimne grupe. Rezultat oduzimanja je "neto" grupna brojnost, odnosno, broj rtava identifikovan u anonimnim grupama koji preostaje nakon to se uklone svi potpuno identifikovani pojedinci. To se moe interpretirati kao minimalna donja granica broja rtava koje nisu dokumentovane kao pojedinci. Minimalan, medijanski i maksimalan neto grupni zbir iznosi 2.755, 2.889 odnosno 5.859. Nakon sabiranja sa 4.400 pojedinačnih rtava, brojnosti grupa daju opte procene koje se kreću od 7.155 do 10.259. Ovim vrednostima procenjen je ukupan broj dokumentovanih rtava. Iz ovih procena isključene su rtve koje nisu dokumentovane ni u sklopu grupa ni kao pojedinci, pa ti brojevi jo uvek pretstavljaju potcenjen ukupan broj smrtnih slučajeva. Druge metode za procenu ukupnog broja rtava ubistava izloene su u Dodatku 2. Dodatak 2: Statistička metodologija i analiza U Dodatku 1 ove studije detaljno je izloen proces kojim je izrađena unakrsna klasifikaciona tablica za broj pojedinačnih rtava ubistava na Kosovu u periodu od marta do juna 1999. Ukupan broj identifikovanih rtava naveden u Dodatku 1 iznosi 4.400, a raspon procena ukupnog broja ubistava na osnovu dokumentovanih ubistava neindentifikovanih rtava iznosi između 7.155 i 10.259. Malo je verovatno da su sva ubistva obuhvaćena procesom prikupljanja podataka koji predstavlja osnovu ovih grubih brojčanih procena. Iz tog razloga, potreban je niz statističkih metodologija da bi se podaci opisani u Dodatku 1 iskoristili za procenu najverovatnijeg broja ubistava na Kosovu u periodu od marta do juna 1999. U Dodatku 2 detaljno je opisana celokupna statistička metodologija koja je potrebna za izvođenje procena kori}enih u glavnom delu ove studije i logika prema kojoj je izabrana ta metodologija. Organizaciona struktura Dodatka 2 jeste sledeća. U Odeljku 1.1, raspravljaju se ograničenja direktnih prebrojavanja kao mere ukupnih ubistava i kretanja ubistava u vremenu i prostoru. Ova ograničenja potakla su korićenje metoda za procenu viestrukih sistema kako bi se izradio model broja ubistava u vremenu i prostoru. U Odeljcima 2.1. do 2.3. predočeno je nekoliko metoda modeliranja procene viestrukih sistema, a u Odeljku 2.4. raspravlja se o procedurama za izbor modela. Odeljak 3 započinje ispitivanjem valjanosti pretpostavki za ove podatke na kojima su zasnovani modeli opisani u Odeljku 2. Odeljak 3 nastavlja skupom procedura za modeliranje kojim se obrazlau ove pretpostavke i koji rezultira nizom interno konsistentnih procena za različite nivoe vremenske i prostorne agregacije[48]. Iako ovaj Dodatak uglavnom dokumentuje nae razmiljanje o načinima procene neprijavljenih rtava, takođe razmatramo druga pitanja u vezi sa modeliranjem koja su vana za hipoteze koje ocenjuje ova studija. U odeljku 4 data je analiza odnosa između broja ubistava i podataka o OVK-u i NATO-u /? podataka o OVK-a i NATO-a/. Ovaj Dodatak se zavrava Odeljkom 5, u kojem je izloena kratka analiza osetljivosti izvetaja o datumima smrti opisanih u Dodatku 1.
Slika 1: Dokumentovana ubistva tokom vremena
24.mart 6.april 24. april 11.maj 18.jun
1.1. Ograničenja direktnih opaanja Direktna procena ubistava dokumentovanih u četiri izvora podataka korićenih u ovoj studiji iznosi 4.400, a direktna procena intervala ukupnog broja ubistava jeste 7.155 do 10.259.[49] Postoji dobar razlog za verovanje da ove brojke ne predstavljaju tačan broj ubistava na Kosovu u toku navedenog perioda. Ovi podaci su prikupljeni iz niza podataka dobijenih kroz razgovore i u toku ekshumacija. Verovanje da su sva ubistva dokumentovana u ovim izvorima podrazumeva da su sva relevantna tela ekshumirana i identifikovana ili da su kod svih ubistava postojali svedoci i da su ta ubistva naveli u intervjuima, ili pak da su sva ubistva obuhvaćena barem jednim od ovih procesa. Takav scenarij je neuverljiv. S obzirom na to da su podaci koji su korićeni za izradu ove studije nepotpuni, postavlja se pitanje koliko tačno oni odraavaju stvarne obrasce ubistava u prostoru i vremenu. Na Slici 1 prikazana su 4.400 dokumentovana ubistva koja su uvrćena u Sliku 4 u Dodatku 1 po dvodnevnim periodima. Valja primetiti da su karakteristike vremenskog sleda procenjene brojnosti predstavljene u glavnom delu ove studije jasno vidljive u vremenskom sledu sirovih brojnosti prikazanih na Slici 1. Najveći broj ubistava desio se u Fazi 1; količina naglo opada 7. aprila, te se ponovo uzdie do vrhunca sredinom aprila. Nakon to je u periodu od 23. do 25. aprila opao gotovo na nulu, sled se početkom maja ponovo uzdie do nekoliko malih vrhunaca. Ovaj sled sirovih brojnosti moe da bude dovoljan da podri analizu sadranu u glavnom delu izvetaja ako se pokae da se prostorno-vremenski obrazac "pravih" brojnosti ubistava na Kosovu tokom perioda od marta do juna 1999. pravilno odraava u dokumentovanim ubistvima koja su unakrsno klasifikovana na Slici 4 Dodatka 1. Nemoguće je direktno uporediti vremenski sled sirovih brojnosti ubistava sa tim "pravim" brojnostima. Međutim, moemo uporediti grupne brojčane podatke opisane u Odeljku 6.3. Dodatka 1 sa pojedinačnim brojčanim podacima. Kako je pokazala analiza neto grupnih podataka u Dodatku 1, bilo je mnogo rtava koje nisu dokumentovane kao imenovani pojedinci. Ako distribucija podataka o pojedinačnim brojnostima u vremenu i prostoru značajno odstupa od distribucije grupnih podataka, verovatno je da ta distribucija moe značajno odstupati od distribucije i od stvarnog broja ubistava. Stepen sličnosti između distribucija pojedinačnih i grupnih podataka izraen je apsolutnom relativnom razlikom između grupnih i pojedinačnih brojnosti podataka:
apsolutna relativna razlika = |grupna brojnost – pojedinačna brojnost| (1) pojedinačni brojnost
Ako su distribucije u vremenu i prostoru za pojedinačne i grupne brojnosti slične, očekivali bismo da apsolutne relativne razlike definisane jednačinom (1) budu konstantne i da distribucija tih apsolutnih relativnih razlika ima malu standardnu devijaciju. U stvari, ako se izračunaju apsolutne relativne razlike za dvodnevne regionalne brojnosti, 114 od 192 jednake su nuli, to ukazuje na savreno slaganje između grupnih i pojedinačnih podataka.[50] Međutim, preostalih 78 apsolutnih relativnih razlika varira od 0,01 do 48, sa medijanom od 0,83, sredinom od 2,67 i standardnom devijacijom od 6,48. Zaključili smo da apsolutne relativne razlike nisu konstantne, to ukazuje na to da pojedinačne i grupne brojnosti po dvodnevnim periodima i regijama ne slede istu distribuciju. Stoga moramo pokuati da procenimo "prave" brojnosti ubistava da bismo potvrdili ili opovrgnuli hipoteze izloene u glavnom delu ove studije o distribuciji ubistava na Kosovu u periodu od marta do juna 1999. U Odeljku 2 navedena je statistička tehnologija koja je za to bila potrebna. Procena viestrukih sistema ili procena viestrukog ponovnog obuhvata ima dugu istoriju, čiji su začeci procene brojnosti populacija ivotinja i biljaka u prirodi. Osnovni model obuhvata i ponovnog obuhvata pojavio se najkasnije kod Petersona (1896) i korićen je u raznim naučnim poljima, uključujući epidemiologiju (vidi International Working Group, 1995a, 1995b), brojnosti opte populacije (vidi Sekar i Deming, 1949; takođe Hogan, 1993, te Anderson i Fienberg, 2001a), kao i na području ljudskih prava za procenu broja ubistava tokom sukoba u Guatemali između 1960. i 1996. (Ball, 2000b). Najprostija verzija ove metodologije, procena dvojnih sistema, primenjuje se kada su dostupne dve zasebno prikupljene, ali nepotpune liste članova neke populacije. Procena dvojnih sistema oslanja se na tri statističke pretpostavke. Prva pretpostavka je da su liste nezavisne, to se statistički opisuje na sledeći način:
Pr(zapis i na listi L1 ½ zapis i na listi L2) = Pr (zapis i na listi L1).
Drugim rečima, ako su liste nezavisne, prisutstvo nekog lica na jednoj listi ne predvi|a prisutstvo ili odsutstvo tog lica na drugoj listi. Druga pretpostavka se tiče homogenosti obuvaćane populacije; drugim rečima, da svaki član populacije ima jednaku verovatnoću obuhvata za datu listu. Konačna pretpostavka je da nema greaka u sravnjivanju lista. Ako su ova tri opisana uslova ispunjena, tada procena dvojnih sistema predstavlja valjanu metodu procene ukupne brojnosti populacije. Neka xi j, i, j Î 0,1} predstavlja brojnost u dvosmerno-unakrsnoj klasifikacionoj tabeli brojnosti populacije za dve liste, kako sledi:
Ovde x00 predstavlja brojnost članova populacije koji nisu obuhvaćeni nijednom listom, a "+" predstavlja sabiranje brojnosti između lista (npr. x1+ = x11 + x10; x+1 = x01 + x11). Cilj je da se proceni N, ukupna brojnost članova populacije, a tradicionalni procenjivač za N je jednostavno
(2)
(3) Problem se javlja kod procene dvojnih sistema ako osnovne pretpostavke o nezavisnosti lista i homogenosti verovatnoća obuhvata ne vae. U tom slučaju, na raspolaganju je nekoliko alternativnih metoda za procenu, ali sve zahtevaju dodavanje barem jo jedne liste sistemu. Iako u proceni dvojnih sistema postoji u osnovi samo jedna metoda procene, dodavanje jedne liste doputa veću fleksibilnost modeliranja za trojne sisteme. U ovom pododeljku razmotrićemo nekoliko metoda za procenu trojnih sistema. Prva, čiji su autori Marks, Seltzer i Krótki (1974), koristi kombinaciju procenjivača dvojnih sistema za određivanje . Druga, koja je preuzeta od Bishopa, Fienberga i Hollanda (1975), zasniva se na loglinearnim modelima. Da bi razmatranje bilo potpuno, ukratko ćemo prikazati procenu trojnih sistema putem modela pune i kvazi-simetrije. Temeljna struktura podataka ista je za sve ove metode; procena trojnih sistema oslanja se na trosmerno unakrsno-klasifikacione tabele brojnosti populacije koje su sastavljene na sledeći način:
Prema ovom načinu beleenja, x000 predstavlja brojnost onih članova populacije koji nisu uključeni ni u jednu od triju lista, dok je svaka od sedam preostalih brojnosti pitanje uočljivosti. Ako se tih sedam brojnosti sabere kao n = x111 + x101 + x011 + x001 + x110 + x100 + x010, dobijamo minimalnu brojnost za ukupnu populaciju. Konačno, neopaeni ukupni broj iznosi N = n + x000.
Marks, Seltzer i Krótki
Marks, Seltzer i Krótki (1974) na početku primećuju da unutar tri sistema postoji est mogućnih procenjivača dvojnih sistema: tri koji nastaju kad se uzmu samo zapisi koji se nalaze unutar dve od tri liste:
(4)
(5)
(6)
i tri koji nastaju saimanjem preko dve liste, čime su iskorićeni svi podaci za procenu dvojnog sistema:
(7)
(8)
(9)
Oni nadalje pokazuju da se opta procena nedostajuće ćelije u problemu trojnih sistema moe dobiti kombinacijom svih est procenjivača dvojnog sistema (4-6) i (7-9). Rezultat toga jeste sledeća jednačina za :
(10)
Marks, Seltzer i Krótki zatim napominju da su jednačine (7-9) podlonije zavisnosti od liste nego (4-6), zbog činjenice da u svakoj od jednačina (4-6), pretpostavka o nezavisnosti vai jedino za zapise koji su zabeleeni u dva izvora korićena u procenjivaču, ali ne i u trećem. Ta manja relaksacija pretpostavke o nezavisnosti čini sledeću procenu robusnijom u pogledu zavisnosti nego jednačina (10):
(11) Bishop, Fienberg i Holland
Alternativni pristup trojnim sistemima jeste procena kroz loglinearno modeliranje (npr. Bishop, Fienberg i Holland, 1975). U nekim strukturama prikupljanja podataka, loglinearno modeliranje moe bolje da uzme u obzir zavisnost nego jednačina (11), kao i da dopusti razuman proračun standardne greke u uzorku i statistike prilagođenosti. Stvaranjem loglinearne reprezentacije za očekivane brojnosti, mijk = E(xijk), oblikuje se model za uočljive }elije koji se zatim projicira na neuočljive ćelije. Oblik tog modela je sledeći:
log (mijk) = u + u1(i) + u2(j) + u3(k) + u12(ij) + u13(ik) + u23(jk) (12)
uz ograničenja na u-članove (npr. da je njihov zbir nula po svim supskriptima). (12) je standardni model bez interakcije drugog reda ili, drugim rečima, model koji dozvoljava zavisnost između parova lista, ali ne i trosmernu zavisnost lista. Budući da postoji samo sedam potencijalno uočljivih brojnosti po ćelijama, to je zasićeni model trojnih sistema koji savreno odgovara podacima, tj. procene maksimalne verodostojnosti za očekivane brojnosti iznose . Unutar tog okvira, redukovani modeli mogu da se prilagode podacima uklanjanjem parametara iz (12). Obično se ovi parametri paljivo uklanjaju da bi se osiguralo da je dobijeni loglinearni model hijerarhijski. Drugim rečima, članovi vieg reda mogu se uključiti samo ako se sa njima povezani članovi nieg reda takođe uključe, tako da parametri vieg reda odraavaju samo odnose vieg reda između lista (vidi Fienberg, 1978).
Za bilo koji odabrani hijerarhijski loglinearni model, procenjuju se očekivane vrednosti ćelija prema modelu i dobijeni model se projicira na nedostajuću (0,0,0) ćeliju. I za zasićene i za redukovane modele, procena N, , jeste:
(13)
Bishop, Fieneberg i Holland (1975) daju asimptotične jednačine varijanci[51], izvedene d-metodom, za svako izvedeno putem hijerarhijskih loglinearnih modela za trojne sisteme. Ove jednačine se koriste u ovom dokumentu za stvaranje priblinih nominalnih[52] 95-postotnih intervala pouzdanosti za procene koje su izvedene iz loglinearnih modela za trosmerne unakrsne klasifikacione tabele.
Ostali modeli
I model Marksa, Seltzera i Krótkog i loglinearni modeli uzimaju u obzir zavisnosti između lista. Međutim, ne uzimaju u obzir heterogenost verovatnoća obuhvata. Jedna jednostavna metoda za modeliranje ove heterogenosti jeste stratifikacija ciljne populacije po demografskim karakteristikama (vidi Hogan, 1993). Drugi pristup zasnovan na modelu jeste upotreba kvazisimetrijskih modela (vidi Cressie i Holland, 1983, Fienberg i Meyer, 1983, Holland 1900, Daroch et al., 1993, te Fienberg, Johnson i Junker 1999). Detaljno tehničko objanjenje ovih modela za procenu trojnih sistema nalazi se u Asher i Fieneberg (2001). Za svrhe ovog dokumenta dovoljno je konstatovati da kod procene trojnih sistema parcijalni kvazisimetrijski modeli daju istovetne rezultate kao i gore opisani loglinearni modeli od est parametara. Tako je korićeno nekoliko kvazisimetrijskih modela u proceduri modeliranja opisanoj u Odeljku 3 ovog dodatka. U ovoj studiji se ne razmatraju puni kvazisimetrijski modeli, budući da ne verujemo da je heterogenost obuhvata istovetna u različitim listama. 2.3. Procena viestrukih sistema Hijerarhijski loglinearni pristup prirodno se protee na modeliranje slo`enijih zavisnosti među 4 liste. Ako je n suma svih zapisa uočenih u kombinaciji sve 4 liste, onda je
(14)
gde je produkt procenjenih očekivanih vrednosti po ćelijama za sve ćelije čiji supskripti daju sumu neparne vrednosti, dok je produkt procenjenih očekivanih vrednosti po ćelijama za sve ćelije čiji supskripti daju sumu parne vrednosti. Formula (14) je samo generalizacija formule (13) i kao takva predstavlja procenu navjeće verodostojnosti za ukupan broj populacije (vidi Fienberg, 1972). Za modele četvorosmerne procene viestrukih sistema koji su uključeni u ovaj dokumenat, intervalske procene za N računaju se pomoću metoda verodostojnosti profila, čiji je autor Cormack (1992), putem programa koji je izradio Matthew Johnson iz Slu`be za testiranje u obrazovanju. Procena verodostojnosti profila skupa pouzdanosti 1 – a za N definisana je kao
N : G2 (N – n) – G2( – n) < c2(1),1 – a } , (15)
gde je G2 devijanca modela, a c2(1),1 – a je 1 – a kvantil c2(1) distribucije. Budući da se Splusovom glm( ) funkcijom procenjuju polinomni model obuhvata i ponovnog obuhvata pomoću Poissonove verodostojnosti, moramo aproksimovati polinomnu devijancu iz Poissonove prilago|enosti. Upotrebili smo aproksimaciju koju je predloio Cormack (1992):
(16)
gde je D(z) devijanca modela za loglinearni Poissonov model za 2J kontingencijsku tabelu sa z u nedostajućoj ćeliji. Uz iznimku modela Marksa, Seltzera i Krótkog, prilagođenost svih modela opisanih u ovoj tački obično se ocenjuje pomoću jedne od sledeće dve statistike:
ili
Obe ove statistike, Pearsonov hi-kvadrat (X2) i devijanca (G2) imaju pribline c2 distribucije sa q stepeni slobode, gde je q broj ćelija u unakrsnoj klasifikacionoj tabeli umanjen za broj parametara koji je uključen u model.[53] Obe statistike daju slične rezultate; međutim, Pearsonov hi-kvadrat je poznatiji. Stoga će se u ovom dokumentu koristiti Pearsonov hi-kvadrat za ocenu prilagođenosti probanih modela, a devijanca za stvaranje nekih intervala pouzdanosti putem metoda verodostojnosti profila. Da bi ocenili prilagođenost loglinearnog modela pomoću Pearsonovog hi-kvadrata, treba da uspostavimo ravnoteu da podaci ne bi bili ni preterano ni nedovoljno prilagođeni. To se postie tako da se prihvataju samo modeli čija Pearsonova hi-kvadrat statistika, kada se uporedi sa c2 distribucijom prikladnog broja stepeni slobode, daje p-vrednost unutar zadanog raspona. Standardni donji prag za p-vrednost za Pearsonov hi-kvadrat iznosi 0,05; modeli sa p-vrednostima niim od ovog praga ne odgovaraju dovoljno dobro podacima, pa se odbacuju. U kontekstu dostupnih modela treba takođe da se odredi prikladna gornja granica koja je potrebna da bi se sprečilo preterano prilagođavanje. Ciljevi statističkih analiza koje su preduzete u okviru ove studije su sledeći:
1. Razvoj globalne procene broja ubistava.
2. Procenjivanje broja ubistava unutar svakog od četiri regiona za svaki dvodnevni vremenski period između 20.-21. marta i 22.-23. juna.
3. Analiza odnosa između broja ubistava za svaki dvodnevni vremenski period i aktivnosti OVK-a i NATO-a.
Komplikovan je razvoj modela i analiza potrebnih za ostvarenje ovih ciljeva. U ostatku ovog odeljka daće se pregled, prema redosledu, metodolokih koraka preduzetih da bi se dovrile procene potrebne za ostvarivanje ciljeva 1 i 2. U odeljku 4 biće reči o cilju 3. 3.1. Analiza eksploratornih podataka Analiza eksploratornih podataka u kontekstu procene viestrukih sistema javlja se u dva oblika. Prvi oblik analize je istraivanje moguće zavisnosti među listama i heterogenosti kroz direktnu analizu karakteristika lista. Na primer, analizujući obrasce prikupljanja podataka po listi, vremenu i mestu, moemo da očekujemo izvesni uvid u kompleksnost procedure modeliranja koju zahteva procena. Drugi oblik analize je poređenje nekoliko rezultata zasićenih modela procene viestrukih sistema niskog nivoa. Moramo paljivo da razjasnimo da ovi modeli, zbog činjenice da su zasićeni, ne predstavljaju kandidate za nau proceduru procene. U ovom momentu nas ne interesuje vrednost procena dobijenih tokom nae analize; samo elimo da utvrdimo međusobni odnos ovih procena. Na taj način su modeli prilagođeni tokom ove procedure samo eksplanatorni, ali ne i konfirmativni. Kad zavrimo analizu eksploratornih podataka, započećemo proceduru za procenu.
Slika 2: Postotak dokumentovanih ubistava, prema izvoru podataka i optini
Direktna analiza liste
Da bismo razumeli prostornu i vremensku heterogenost za četiri liste, analiziraćemo obrasce prikupljanja podataka. Slika (2) prikazuje obrasce prikupljanja podataka za svaku od četiri liste prema regiji.[54] Postoci pretstavljaju udeo dokumentovanih ubistava za datu listu unutar svake optine ili regiona. Treba primetiti da liste imaju veoma različite obrasce prikupljanja podataka; na primer, HRW pokriva proporcionalno manje regiju 2 i proporcionalno vie regiju 4 nego druge liste. To ukazuje na to da postoji heterogenost lista koja se moe reiti stratifikacijom po regijama. Moe da se izvri slična analiza kako bi se odredili obrasci prikupljanja podataka po listama tokom vremena. Slika (3) prikazuje obrasce prikupljanja podataka za svaku od četiri liste tokom dvodnevnih vremenskih perioda, gde postoci predstavljaju udeo dokumentovanih ubistava za datu listu u svakom vremenskom periodu. Periodi u tabeli predstavljaju vremenske odsečke koji su od interesa za glavni deo ove studije. I ovde se čini da HRW sledi drugačiju distribuciju prikupljanja podataka tokom vremena od drugih lista, to ukazuje na heterogenost lista koja se moe reiti stratifikacijom po vremenu.
Eksploratorna procena dvojnih i trojnih sistema
Zavisnost i heterogenost lista mogu da se istrauju direktno, pomoću statističkog aparata za procenu viestrukih sistema. Pomoću parova lista moe da se oblikuje est procena dvojnih sistema za globalni broj ubistava, tako to se utvr|uje koliko se blisko podudaraju. Tih est procena prikazano je na Slici (4).
Slika 3: Postotak dokumentovanih ubistava, prema izvoru podataka i dvodnevnom vremenskom periodu
Slika 4: Procene dvojnih sistema
Treba primetiti da sve osim dveju ovih procena padaju ispod n = 7.155, to je najnia procena ukupnog broja dokumentovanih ubistava. To upu}uje na visok stepen pozitivne zavisnosti između lista, to broj ubistava koja su zabeleena na obe liste (u x11 ćeliji) čini viim, a opte procene stoga niim. Izuzeci su procena dvojnih sistema pri kojoj su korićene dve liste, ABA i EXH, i procena dvojnih sistema pri kojoj su korićene dve liste, ABA i HRW. Uz to, čini se da postoji izvesna varijabilnost između procena (one se proteu od 5.461 do 9.689), to ukazuje na heterogenost pozadinskih obuhvata verovatnoća. Ako pogledamo zasićene procene trojnih sistema, dobijamo veći uvid u vii stepen zavisnosti između lista. Na Slici 5 navedene su ove procene.
Rezultati obećavaju malo vie: nestale su pozitivne zavisnosti između lista koje su bile očigledne na dijagramu procene dvojnih sistema, to ukazuje na to da su zavisnosti između lista dobro modelirane dvosmernim interakcionim članovima. Međutim, treba ista}i istaknuti da je procena ABA-e, EXH-a i OEBS-a preterano velika u odnosu na ostale procene, to ukazuje na postojanje nekih negativnih zavisnosti vieg reda za ovaj skup sistema, dok se procena EXH-a, HRW-a i OEBS-a čini donekle niskom, to ukazuje na postojanje pozitivnih zavisnosti vieg reda među ovim listama.
Slika 5: Procene trojnih i četvorosmernih sistema (zasićene)
I direktna analiza obrazaca prikupljanja podataka i istraivanje obrazaca u procentima dvojnih i trojnih sistema ukazuje na to da između lista postoji visok stepen zavisnosti i heterogenosti. Stoga je prikladno da se za punu unakrsnu klasifikacionu tabelu prikazanu na Slici 4 Dodatka 1 istrai komplikovana procena četvorosmernih viestrukih sistema. U Odeljku 3.2. opisuje se procedura izbora koja je korićena za određivanje modela najvieg nivoa za globalnu[55] brojnost ubistava. 3.2. Prilagođavanje i izbor modela za ukupan broj ubistava Postoji 113 mogućnih hijerarhijskih loglinearnih modela za četvorosmernu unakrsnu klasifikacionu tabelu prikazanu na Slici 4 Dodatka 1, ali samo njih devet daje Pearsonov hi-kvadrat sa p-vrednoću većom od 0,05. Radi potpunosti, ovih devet modela prikazano je na Slici 6. Sistem obeleavanja koji je korićen za predstavljanje modela je sledeći: interakcioni članovi predstavljeni su kao zajednički pomnoene liste; npr; ABA*EXH*HRW predstavlja trosmerni interakcioni član ovih lista. Budući da su izloeni modeli hijerarhijski, svaki izloeni interakcioni član takođe predstavlja svoje članove nieg reda; npr; ABA*EXH*HRW predstavlja skup članova ABA, EXH, HRW, ABA*EXH, ABA*HRW, EXH*HRW i ABA*EXH*HRW}. Pet modela (1-4 i 7) imaju p-vrednosti iznad 0,30, dok ostalih četiri ima p-vrednosti između 0,06 i 0,08. S obzirom na ovu činjenicu, čini se logičnim da se izabere 0,3 kao gornja granica za p-vrednost kako bi se izbeglo preterano prilagođavanje. Nakon toga, ostaje nam zadatak da izaberemo najbolji od preostala četiri modela (5, 6, 8 i 9). Najlake bi bilo prosto uzeti model sa najniim Pearsonovim hi-kvadratom. Međutim, ako tako uradimo, zanemarićemo drugu dobru meru za modele – ekonomičnost, koja se meri minimalizacijom broja parametara odnosno maksimalizacijom stepeni slobode. Minimalizacija Pearsonovog X2 teiće ka modelima sa najtenjom prilagođenoću i stoga najkompleksnijim modelima. Kao mogući kompromis između `elje da se izabere najbolje prilagođen model i `elje da se stvori najjednostavniji model za na "najbolji" model izabrali smo onaj koji ima minimalno korigovan Pearsonov hi-kvadrat, X2/d, gde je d broj stepeni slobode. Pomoću ove statistike, izabran je model (9), koji daje globalnu procenu od 10.356 ubistava, sa 95-postotnim intervalom pouzdanosti (9.002, 12.122). Ovaj model daje konzervativnu procenu, budući da samo jedan model na Slici 6 daje nii . 3.3. Agregacija unakrsnih klasifikacionih tabela za objanjenje oskudnosti Sledeći cilj ove analize jeste procena broja ubistava za svaku od 192 prostorne/vremenske tačke koje predstavljaju 48 dvodnevnih perioda i četiri geografske regiona. Da bi se to izvrilo, ćelije na Slici 4 Dodatka 1 moraju da se deagreguju u 192 unakrsne klasifikacione tabele. Nastojanje da se provede ova deagregacija pokazalo se prilično problematičnim. U koloni 4 Slike 7 navedene su frekvencije dvodnevnih unakrsnih klasifikacionih tabela sa 0-15 nula ćelija. Treba primetiti da, prema optem pravilu, maksimalan broj nula ćelija koji doputa valjano loglinearno modeliranje za procenu četvorosmernih viestrukih sistema iznosi 10; to doputa po jednu brojnost koja nije jednaka nuli za svaki od parametara modela nezavisnosti. Od 192 dvodnevne tabele, njih 122 (64%) sadri vie od 10 nula ćelija. Uz to, oskudnost tabela koje doputaju procenu viestrukih sistema, a sadre velik broj nula ćelija, moe dovesti do iskrivljene procene.
Slika 6: Rezultati za modele globalne brojnosti ubistava
X2 = Pearsonov hi-kvadrat, d = stepeni slobode, Pr. = p-vrednost Dev. = preostala devijanca, C.I. = interval pouzdanosti
Slika 7: Brojevi nula ćelija za četvorosmerne tabele
Saimanje na 24 četvorodnevna perioda u četiri regiona daje 96 unakrsnih klasifikacionih tabela; od toga 48 (50%) sadri vie od 10 nula ćelija. Saimanje na 16 estodnevnih perioda u četiri regiona daje 64 unakrsne klasifikacione tabele; od toga 26 (41%) sadri vie od 10 nula ćelija. Daljnje saimanje omelo bi eljenu analizu. Drugu opciju za saimanje preko vremenskih tačaka daje saimanje preko lista. Postoji mogućnih trosmernih unakrsnih klasifikacionih tabela za svaku četvorosmernu unakrsnu klasifikacionu tabelu. To daje trosmerne unakrsne klasifikacione tabele od kojih svaka predstavlja dvodnevni interval, regiju i "sistem" lista. U ovom slučaju, vie od tri nule sprečiće loglinearno modeliranje za procenu trojnih sistema. Na slici 8, sistemi se kreću u rasponu od 117 i 142 tabele sa vie od tri nule, to rezultira time da je barem 70% ukupnih tabela između četiri sistema preoskudno za procenu trojnih sistema. Ovaj postotak je donekle zavaravajući, jer je svaka prostorna i vremenska tačka predstavljena pomoću četiri unakrsne klasifikacione tabele (po jedna za svaku listu). Stvarna pokrivenost prostornih/vremenskih tačaka pomoću ovih 768 tabela moe da iznosi znatno vie od 30%. Čini se da je procena trojnih sistema na nivou dvodnevnih perioda i regija komplikovana, te je potrebna kombinacija smanjivanja unakrsnih klasifikacionih tabela (s četvorosmernih na trosmerne) i saimanja po dvodnevnim periodima. Na Slikama 9 i 10 date su brojnosti nula za unakrsne klasifikacione tabele za četvorodnevne, odnosno estodnevne periode. Saimanje na estodnevne periode unutar trosmernih unakrsnih klasifikacionih tabela čini se kao prihvatljivo reenje za oskudnost podataka. Iako na ovom nivou agregacije jo uvek postoji velik broj oskudnih unakrsnih klasifikacionih tabela, redundantnost četiri trosmerna sistema omogućava da većina estodnevnih vremenskih i regionalnih tačaka bude procenjiva. Neprocenjive vremenske i prostorne tačke uglavnom se javljaju kasnije u vremenskom rasponu od 96 dana, gde postoji manji interes za razumevanje tendencija podataka. Uz to, saimanje dvodnevnih tabela po regiji unutar trosmernih unakrsnih klasifikacionih tabela omogućiće modeliranje na istančanijem vremenskom nivou, to će omogućiti bolje razumevanje optih vremenskih tendencija u podacima. U Odeljcima 3.4. i 3.5. ovog Dodatka biće izloena dva skupa procena, koji će se zatim upoređivati u Odeljku 3.6.
Slika 8: Brojnosti nula ćelija za trosmerne tabele (dvodnevni period)
Slika 9: Brojnosti nula ćelija za trosmerne tabele (četvorodnevni period)
Slika 10: Brojnosti nula ćelija za trosmerne tabele (estodnevni period)
3.4. Globalno prilagođavanje modela među svim vremensko-prostornim tačkama Ova je analiza je započeta izradom globalne procene broja ubistava, koji je procenjen pomoću četvorosmernog modela za procenu viestrukih sistema prilagođenog prema Slici 4 Dodatka 1. Jedna opcija za modeliranje brojnosti na pojedinačnim prostornim/vremenskim tačkama jeste da se izgradi opti linearni model u kojem se procenjuju parametri koji predstavljaju svaku pojedinu vremensku/prostornu tačku kao i parametri povezani sa odabranim modelom globalne procene viestrukih sistema, sa modelom 9 na slici 6.. Ovaj opti model projektovaće globalni model sve do deagregovanih tačaka, to će omogućiti potpunu proceduru modeliranja za ceo sistem procena. Da bi se izvrilo podeavanje zbog oskudnosti, podaci su saeti na estodnevne vremenske tačke, a uključeno je samo prvih deset od ovih tačaka56. Rezultat je 71-parametarski model prilagođen brojnostima ubistava, sa matricom indikatorskih varijabli koje slue kao prediktori, od 70 stubaca. Iako ovi rezultati upućuju na zanimljive trendove, p-vrednost za Pearsonovu X2 statistiku je beznačajan. Taj nedostatak prilađenosti moe da se objasni na sledeći način: iako globalni model dobro opisuje deagregovanu tabelu, on ne daje dobar opis svake prostorne/vremenske tačke. Opti generalizovani linearni model omogućava da jedan model interakcija među listama opie odnose među listama za svaku prostornu/vremensku tačku; heterogenost prostornih/vremenskih tačaka čini ovaj model neuspenim na lokalnom nivou. Reenje je da se omogući da opti generalizovani linearni model sadri parametre lista za svaku prostornu/vremensku regiju; počevi od potpuno zasićene matrice 14 listovnih parametara * 40 prostornih/vremenskih tačaka + 40 prostornih/vremenskih indikatora, moe da se primeni stepenasta procedura za izbor 40 modela koji najbolje opisuju 40 prostornih/vremenskih tačaka. To je ekvivalentno vođenju 40 odvojenih generalizovanih linearnih modela, osim to statistika prilagođenosti za opti model meri prilagođenost celog sistema, dok statistike prilagođenosti za 40 lokalnih modela mere svaku prilagođenost zasebno. Očigledno je jednostavnije voditi odvojene loglinearne modele za svaku vremensku/prostornu tačku. Ova procedura za procenu po delovima viestrukih sistema biće detaljnije raspravljena u Odeljku 3.5. 3.5. Modeliranje po delovima među vremenskim i prostornim tačkama Usled oskudnosti podataka, primena modela za procenu četvorosmernih viestrukih sistema, čak i sa podacima koji su agregovani u estodnevne periode, daće vrlo malo modela koji su prihvatljivi sa stanovita prilagođenosti. Saimanje na procene dvojnih sistema daje modele za koje ne postoji merenje prilagođenosti, te za koje znamo da pretpostavke o nezavisnosti i homogenosti ne va`e. Reenje koje preostaje - procena trojnih sistema – na svoj je način sloeno. Postoji = 4 mogućnih trosmernih sistema, a unutar svakog sistema postoji 8 mogućnih modela. Rezultat toga su do 32 modela za svaku od 64 vremenske i prostorne tačke. Potrebno je odrediti pravilo izbora prema kojem se moe odabrati "najbolji" model. Sledeći skup pravila - jedan za dvodnevne tabelarne modele i jedan za estorodnevne tabelarne modele prema regiji - odraava proceduru izbora za opti model, uz jednu vanu razliku: izbor gornje granice za p-vrednost Pearsonovog hi-kvadrata. Pomicanje gornje granice previsoko doveće do preterane prilagođenosti modela, ali pomicanjem granice nadole naposletku se odbacuju svi modeli za neku vremensku i/ili prostornu tačku. Stoga je odabrano da gornja granica p-vrednosti za svaki od dva skupa modela bude to manja, uz istovremeno to veći broj prostornih/vremenskih tačaka koje se procenjuju. Za estodnevne modele prema regionu, p-vrednost iznosi 0,7, a za dvodnevne modele, p-vrednost je 0,5. Pravila izbora modela za dvodnevne procene su sledeća:
· Ukloniti sve modele za koje < x++++ (zadrano je 1132 od 1402 modela). · Ukloniti sve modele za koje > 10.356 (zadrano je 974 od 1132 modela).57
· Ukloniti sve modele za koje p < 0,05 (zadrano je 657 od 974 modela).
· Ukloniti sve modele za koje p > 0,5 (zadrano je 247 od 657 modela).
· Odabrati model sa najniim prilagođenim Pearsonovim hi-kvadratom. · Ako ne postoji nijedan takav model, onda < x++++.
Pravila izbora modela za estodnevne procene su sledeća:
· Ukloniti sve modele za koje < x++++ (zadrano je 1455 od 1856 modela) · Ukloniti sve modele za koje > 10.356 (zadrano je 1235 od 1455 modela)
· Ukloniti sve modele za koje p < 0,05 (zadrano je 876 od 1235 modela).
· Ukloniti sve modele za koje p > 0,7 (zadrano je 381 od 856 modela).
· Odabrati model sa najniim prilagođenim Pearsonovim hi-kvadratom. · Ako ne postoji nijedan takav model, onda < x++++.
Ciljevi izneseni na početku ovog odeljka uključivali su stvaranje procena za svaki dvodnevni vremenski period između 20.-21. marta i 22.-23. juna unutar svakog regiona. Do ove tačke, napravljene su procene za estodnevne periode unutar regiona, kao i procene za dvodnevne periode agregovane po regionima. Niz dvodnevnih procena za svaki region moe da se izradi iz ovih dvaju odvojenih skupova procena na sledeći način:
· Svaka estodnevna procena na regionalnom nivou projektuje se na tri dvodnevne procene na globalnom nivou. Neka t Î (1,16) označava estodnevni interval, a t1, t2 i t3 označavaju dvodnevne intervale povezane s t. Neka tr označava procenu za estodnevni interval t i regiju r. Naposletku, neka označava procenu za dvodnevni interval tj i regiju r.
· Za estodnevnu procenu tr, treba napraviti proporciju za svaku od tri dvodnevne procene na sledeći način:
(17)
· Treba oblikovati dvodnevnu procenu za ti, region r, kako sledi:
(18)
Rezultirajuće dvodnevne procene za region r predstavljaju meavinu informacija o regionalnom i globalnom trendu u podacima. 3.7. Poređenje rezultata globalnog i pojedinačnog modeliranja Na Slikama 11 i 12, zajedno su grafički prikazane procene pojedinačnih i optih modela brojnosti ubistava, uz intervale pouzdanosti za pojedinačne procene. Ovi grafički prikazi imaju dve ohrabrujuće karakteristike. Prva je da su procene izvedene iz opteg modela prilično slične procenama izvedenim iz pojedinačnih modela; obe sugeriu iste vremenske trendove u obliku talasa ubistava. Druga je da oblik područja pouzdanosti, formiranih oko procena pojedinačnih modela, odrava oblik krivulja dobijenih procenama. Ako se bilo koja tačka u intervalima pouzdanosti uzme kao prava brojnost ubistava, time se neće ukloniti ovi trendovi. Jo jedna ohrabrujuća karakteristika rezultata viestrukih oblika procedura modeliranja jeste koliko dobro procene slede jedna drugu. Na Slici 13 prikazano je nekoliko verzija agregovanih procena iz četiri različite provedene procedure modeliranja. Sve opte procene ukupnog broja ubistava su unutar intervala pouzdanosti procene globalnog modela; neke agregovane procene su sasvim blizu broja 10.356. Opti trendovi tokom vremena čine se sličnim kako kod procena estodnevnog perioda agregovanih po regionima tako i kod procena dvodnevnog perioda agregovanih po vremenu. Čini se da sistem modela dobro funkcionie. Kao konačna provera kvaliteta procedure modeliranja napravljene za ovu studiju, procene koje su proizvedene u svakom sistemu modeliranja upoređene su sa procenama proizvedenim uzimanjem proseka četiri procene trojnih sistema Marksa, Seltzera i Krótkog, koje su date jednačinom (11). Na Slici 14 navedeno je koliko puta procena Marksa, Seltzera i Krótkog pada unutar intervala pouzdanosti delimične procene. Čini se da se dve procene bolje slau na niim nivoima agregacije u prostoru i vremenu. To ne iznenađuje; iako model Marksa, Seltzera i Krótkog objanjava određen stepen zavisnosti između lista, on nije onoliko fleksibilan koliko su fleksibilni hijerarhijski loglinearni modeli. Kao takav, bolje će da funkcionie ako je heterogenost blaga ili je nema.
Slika 11: Procena broja ubistava tokom vremena, sa nominalnim intervalom pouzdanosti
24. mart 6. april 24. april 11. maj
Do ove tačke u ovom dodatku koncentrisali smo se na izradu procena brojnosti ubistava. Međutim, moguća je interesantna sporedna analiza odnosa odnosa između lista usled prirode procedure izbora modela za pojedinačne procene. Vrenjem ove analize i njenim upoređivanjem sa obrascima datim u Odeljku 3.1, dobićemo uvid u to koliko je dobro procedura pojedinačnog modeliranja podeena prema obrascima prostorne i vremenske heterogenosti. Na Slici 15 navedeni su izvorni sistemi za svaku od estodnevnih procena po regionima i dvodnevnih procena. Prva kolona brojnosti pokazuje broj procena izvedenih iz svakog od tri sistema lista; drugi stupac brojnosti iskazuje broj procena, kojima je ta lista pridonela. Iako se čini da je svaka lista pridonela otprilike istom broju procena, sistem ABA, EXH i OEBS verovatno daje najveći ukupni broj procena. To je i logično s obzirom na strukturu lista koje su u osnovi procene. HRW je primenjivao drugačiju strategiju prikupljanja podataka, to je dovelo do razlike kako u vremenu tako i u prostoru, čime je pove}ana heterogenost listovnih sistema koji su je sadr`avali. Takođe, Human Rights Watch oslanjao se na istraivačku strategiju prikupljanja podataka kojom se stvara drugačiji skup pojedinačnih verovatnoća obuhvata nego kod strategije nabrajanja koju su primenjivale druge organizacije58.
Slika 12: Procena broja ubistava sa nominalnim intervalom pouzdanosti, prema regionu tokom vremena (estodnevni periodi projektovani na srednji dan perioda)
24. mart 6. april 24. april 11. maj 18. jun
24. mart 6. april 24. april 11. maj 18. jun
24. mart 6. april 24. april 11. maj 18. jun
24. mart 6. april 24. april 11. maj 18. jun
Slika 13: Poređenje procena prema različitim procedurama modeliranja
Slika 14: Poređenje procena Marksa, Seltzera i Krótkog sa procenama prema drugim procedurama modeliranja
Slika 15: Odnos između kriterijuma izbora modela i lista
Slika 16: Odnos između kriterijuma izbora modela i lista po regionu
Prostorne i vremenske zavisnosti liste mogu da se primete u obrascima sistema odabranim za procene u pojedinim regionima ili vremenskim intervalima. Sledeće dve tabele, prema redosledu, pokazuju brojnosti sistema koje pridonose procenama najprije prema regionu, a zatim vremenu. I ovde su prikazani zbirovi broja procena kojima je pridonela svaka lista, kao i broj procena kojima je pridonela svaka lista. Šest procena kojima su pridoneli EXH, HRW i OEBS u Regionu 4 posebno su interesantne. Gotovo polovina modela ovih sistema nalaze se u Regiji 4, a polovina modela u Regiji 4 su iz ovog sistema. Takođe je od interesa obrazac dvaju HRW,OEBS sistema tokom vremena; dok je doprinos drugih sistema grubo uzev, ve}i u početku nego kasnije, ABA, HRW, OEBS pridonose najvie prema sredini vremenskog okvira. Ovi obrasci odraavaju neke od prostornih i vremenskih zavisnosti između lista i jo vie potvrđuju potrebu za fleksibilnim i slo`enim sistemom modeliranja. Konačna mera prostornih i vremenskih zavisnosti između lista data je na Slici 18. Ovaj skup brojnosti prema broju parametara u modelu ukazuje na slo`enost modela za procene. Dok su estodnevne procene prema regionu ravnomerno raspore|ene između najslo`enijih i najjednostavnijih tipova modela, četiri petine dvodnevnih procena izvedene su iz najslo`enijeg tipa modela.
Slika 17: Odnos između kriterijuma izbora modela i lista prema vremenskoj tački
Slika 18: Slo`enost izabranih modela upoređenih prema nivou agaregacije
Interpretacija ovih opaanja je relativno jednostavna. Šestodnevne procene po regionu odraavaju nii stepen geografije; unutar manjih geografskih jedinica odnosi između lista manje su komplikovani nego kod većih geografskih jedinica. Drugim rečima, geografskom "stratifikacijom" područja procene, smanjuju se zavisnosti i heterogenost. Međutim, u slučaju dvodnevnih procena, zavisnosti među listama nisu bile "stratifikovane" te su slo`eniji modeli bolje prilagođeni. 4. Analiza odnosa između rezultata modeliranja procene viestrukih sistema i aktivnosti OVK/NATO-a Do ove tačke, sva statistička metodologija i analize koje su opisane u ovom Dodatku bile su direktno povezane sa procenom brojnosti ubistava. Izvrena je jedna dodatna statistička analiza pri kojoj su se koristile već napravljene procene; o toj analizi }e sada biti reči. U glavnom delu ove studije, razmatra se odnos između vazdunih udara NATO-a na Kosovu, aktivnosti OVK-a na Kosovu i obrazaca ubistava i migracije izbeglica. Metoda statističke analize koja omogućava bolje razumevanje ovih odnosa jeste jednostavna linearna regresija pri kojoj se koriste procene ubistava i kretanja migracije unutar određenog prostornog i vremenskog regiona kao zavisna varijabla. Potencijalne eksplanatorne varijable za model uključuju broj bitaka OVK-a unutar prostornog i vremenskog regiona, broj ubistava OVK-a unutar prostornog i vremenskog regiona, broj vazdunih udara NATO-a unutar prostornog i vremenskog regiona, broj bitaka OVK-a unutar prethodnog prostornog i vremenskog regiona, broj ubistava OVK-a unutar prethodnog prostornog i vremenskog regiona i broj vazdunih udara NATO-a unutar prostornog i vremenskog regiona. Kao nezavisne varijable mogu se koristiti i kvazivarijable, da bi se kontrolisala mogućnost da aktivnosti u jednom regionu dominiraju analizom.
Regresionom analizom pomoću gore opisanih varijabli moe da se proceni veza između aktivnosti NATO-a i OVK-a i migracija i ubistava Albanaca, prema nivoima va`nosti modela i svakog pojedinog parametra u modelu. Na Slici (19) prikazani su rezultati za četiri regresiona modela. U prvom i trećem varijable predstavljaju dvodnevne periode za celu zemlju, a u drugom i četvrtom estodnevne periode unutar regiona. Nivo va`nosti parametara dat je obrascem * = 0,05, ** = 0,01 i *** = 0,001. Za regresione modele kod kojih se ubistva koriste kao zavisna varijabla, jedini značajni parametri su oni koji označavaju regionalne efekte. Drugim rečima, veza između varijabli OVK i NATO-a i brojnosti ubistava je slaba. To potvrđuju i niske vrednosti R2 za ova dva modela, koje iznose 0,253 i 0,147.
Međutim, regresioni modeli kod kojih su migracije zavisna varijabla daju drugačiju interpretaciju. U ovom slučaju, čini se da postoji veza između aktivnosti OVK-a i migracije; preciznije, veza između bitaka OVK-a unutar prethodnog vremenskog perioda i migracija u tekućem vremenskom periodu čini se značajnom. Vrednosti R2 za oba ova modela su visoke, to samo potvrđuje tu vezu. U ovom momentu regresioni rezultati upu}uju na to da obrazac bombardovanja koje je tokom vremena NATO izvrio na Kosovu nije značajno povezan sa obrascem ubistava ili migracija na Kosovu tokom vremena. Međutim, čini se da je obrazac aktivnosti OVK-a povezan sa obrascem migracije. Daljnji dokaz nedostatka veze između aktivnosti OVK-a, NATO-vih bombardovanja i obrazaca ubistava na Kosovu daje poređenje reziduala iz svake od gore opisanih regresija sa njihovim zavisnim varijablama. Ako regresioni model dobro opisuje svoju zavisnu varijablu, tada će reziduali za taj regresioni model biti nasumični. Međutim, ako regresioni model ne daje dobar opis svoje zavisne varijable, tada će reziduali tokom vremena slediti isti obrazac kao i prvobitna zavisna varijabla. Slike 20 i 21 prikazuju poređenja reziduala za modele za koje ubistva i migracije unutar estodnevnog perioda i regiona predstavljaju zavisne varijable. Na Slici 20, reziduali usko prate procenjene brojnosti ubistava, podravajući jasne trendove u podacima. Na Slici 21, odnos između reziduala i kretanja migracije je očigledan, ali ne tako snaan kao odnos između reziduala i ubistava u prethodnom modelu. To ne iznenađuje s obzirom na bolju prilagođenost regresionog modela za kretanje migracije. Međutim, odstupanja između nizova javljaju se tek na nekoliko tačaka. U junim i zapadnim regionima reziduali usko prate procenjene vrednosti. Kada nizovi me|usobno odstupaju u tim regionima, to je samo zbog toga to reziduali preuveličavaju trend koji je očigledan u nizu kretanja izbeglica; ovaj obrazac je uočljiv u zapadnom regionu na početku Faze 2. U severnom i istočnom regionu, nizovi se jače razlikuju. No čak i u tim regionima, vrhovi sredinom aprila u Fazi 2 pokazuju jasnu sličnost kod kretanja izbeglica i nizova reziduala. U severnom i istočnom regionu tokom Faze 1 i na prelazu u Fazu 2, nizovi su međusobno protivrečni. Nai zaključci su sledeći:
· Na osnovu analize ovih podataka, nema dokaza koji bi podravali teoriju da su bombardovanja koje je izvrio NATO ili aktivnost OVK povezani sa obrasicma ubistava na Kosovu.
· Postoje neki dokazi za vezu između aktivnosti OVK-a i migracionih obrazaca u severnom i istočnom regionu, posebno tokom Faze 1.
· Veza između aktivnosti OVK-a i kretanja migracije ne objanjava u potpunosti obrazac migracije, posebno kada je reč o zapadnom i junom regionu.
Slika 19: Koeficijenti regresije
Slika 20: Procena ukupnog broja ubistava i reziduala prema regiji tokom vremena
24. mart 6. april 24. april 11. maj 22. jun
24. mart 6. april 24. april 11. maj 22. jun
24. mart 6. april 24. april 11. maj 22. jun
24. mart 6. april 24. april 11. maj 22. jun
U ovom dodatku su predstavljene glavne metode modeliranja koje smo primenjivali. U ovom zavrnom odeljku, objanjava se metoda analize osetljivosti izvetaja o datumu smrti, te se daje saetak zaključaka za ovaj dodatak. 5.1. Analiza osetljivosti izvetaja o datumu smrti Kada su zapisi o pojedincima sravnjivani sa drugim pojedincima i grupama, to je rezultiralo nagomilavanjem datuma. Izbor "najboljeg" datuma opisan je u Dodatku 1.
Slika 21: Procena kretanja izbeglica i ostataka prema regionu tokom vremena
24. marta 6. aprila 24. aprila 11. maja 25. maja
24. marta 6. aprila 24. aprila 11. maja 25. maja
24. marta 6. aprila 24. aprila 11. maja 25. maja
24. marta 6. aprila 24. aprila 11. maja 25. maja
Slika 22: Procena broja ubistava tokom vremena sa alternativno dodeljenim datumima
24. marta 6. aprila 24. aprila 11. maja 22. juna
Čak i ako je izbor "najboljeg" datuma bio odgovarajući, ipak poneki "najbolji" datumi mogu biti pogreni. Vreme je centralna dimenzija ovde testiranih hipoteza. Stoga je korisno razmotriti da li je sutinska interpretacija rezultata robustna prema različitim pretpostavkama o kvalitetu informacija o datumima, Za analizu osetljivosti odabrani su verovatni "raniji" i "docniji" datumi kao alternative svakom zapisu. Datumi su akumulirani iz svih grupnih i pojedinačnih zapisa koji su se podudarali sa svakim pojedinačnim zapisom, kako u procesu samosravnjivanja tako i u intersistemskom sravnjivanju. Za zapise koji su sadravali tri ili vie datuma u svojoj distribuciji uzimani su datumi na 25. i 75. odstotku kao "raniji" odnosno "docniji" datumi. Za zapise sa dva datuma uzimana su ova dva datuma kao raniji odnosno docniji datum. Razlika između ranijih i docnijih datuma definisala je raspon. Zapisima sa 1 ili 0 datuma dodeljen je raspon pomoću hotdecking procedure; kao i ranije, imputovani zapisi sravnjivani su prema geografskoj lokaciji. Docniji i raniji datumi za ove zapise bili su povećani ili smanjeni za polovinu imputovanog raspona; vrednosti su zaokruene na sledeći ceo broj. Na taj način su svi zapisi promenjeni barem za jedan dan jer smo pokuavali da to vie pojačamo dejstvo ovog testa. Rezultat toga je distribucija ubistava tokom vremena koja je prikazana na Slici 22. Promena datuma ne utiče na oblik krivih. Pomeranjem ubistava na ranije datume ispunjava se period krajem marta i početkom aprila dok se istovremeno oduzima kvantitet vrhu sredinom aprila. Pomeranje ubistava na docnije datume pomiče ih sa vrhova u Fazi 1 na vrhove u Fazi 2 i Fazi 3. Najvaniji nalaz ove analize jeste da čak i ovo značajno restrukturiranje načina postupanja sa podacima ne menja osnovne karakteristike obrasca tokom vremena. Oba promenjena niza imaju visoke vrhove u početku i sredini Faze 1. Oba niza pokazuju znatno opadanje tokom prelaza između faza od 5. do 8. aprila, a svaka ima svoj vrh u sredini Faze 2. Promenjeni niz se ne sla`e u vezi s tim kada je bio tačan momenat prelaza iz Faze 2 u Fazu 3: dva dana ranije (u docnijem i slučajnom nizu) ili dva dana docnije u ranijem nizu. Da su vrhovi i dolovi u obrascu ubistava tokom vremena stvoreni pomoću naročite tehnike za obradu datuma, onda bi jedna ili vie promena pokazivala slučajni obrazac. Da su prijavljeni datumi bili iroko raspreni, rasponi bi bili dovoljno iroki pa bi promene izgladile obrazac "početka i prestanka" koji je karakterističan za ubistva i kretanje izbeglica na Kosovu od marta do juna 1999. Činjenica da se to izglađivanje nije dogodilo jeste dokaz da je procedura procene robustna prema nepreciznim izvetajima o datumu ubistava. 5.2. Saetak zaključaka modeliranja Ovaj dodatak započeli smo dilemom kako da se procene neopaena (ili barem neprijavljena) ubistva u cilju procene ukupnog broja smrtnih slučajeva. Modeliranje predstavljeno u Dodatku 2 uverava nas da je u periodu od 20. marta do 22. juna 1999. verovatno ubijeno neto preko 10.000 kosovskh Albanaca. Najveća direktna procena se mo`e uporediti sa ovom "najboljom" procenom modela, a različiti modeli daju slične procene. Verujemo da smo pravilno izloili argumentaciju u vezi sa ukupnim brojem ubistava i obrascem ubistava u navedenom periodu. Na toj osnovi doneli smo zaključke izloene u glavnom delu izvetaja.
Dodatak 3: Dodatni izvori za aktivnosti OVK i NATO-a
Albanska grupa za ljudska prava
Albanski mediji
Beogradski centar za ljudska prava
Centar za mir i toleranciju
Daily Telegraph
Danas
Egipatska nacionalna zajednica na Kosovu
Posmatračka misija Evropske zajednice
Evropski centar za prava Roma
Ministarstvo odbrane Savezne Republike Jugoslavije (SRJ)
Organi civilne zatite SRJ
Ministarstvo inostranih poslova SRJ
Ministarstvo informisanja SRJ
SRJ, Ed memoar o korićenju nehumanog oruja u agresiji Organizacije severnoatlantskog pakta protiv Savezne Republike Jugoslavije, Beograd, 15. maj 1999.
Fond za humanitarna prava
The Guardian
Odbor za ljudska prava Sandaka
Informativna sluba Crkve i Narodne skuptine (Kosovo)
Me|unarodni komitet Crvenog krsta
Međunarodni krivični sud za bivu Jugoslaviju
Koha Ditore
Kosovapress
Kosovski mediji
Verifikaciona misija za Kosovo
Lokalni crkveni odbori (Kosovo)
Los Angeles Times
A`urirani prikaz operacije “Zdruena sila” NATO-a
Institut "Otvoreno drutvo"
Organizacija za evropsku bezbednost i saradnju
Organizacija porodica nestalih
Orthodoxy Press
Politika
Izvetaj vladike Artemija "Spisak ubijenih i otetih Srba", Ministarstvo unutranjih poslova Republike Srbije
RTS TV Beograd
Srpski mediji
Srpska pravoslavna crkva
NewsBits Kongresa srpskog jedinstva
SVEDOK - beogradski nedeljnik
Tanjug
Visoki komesarijat Ujedinjenih nacija za izbeglice
V.I.P. Daily News Report
American Bar Association Central and East European Law Initiative and the American Association for the Advancement of Science. 2000. Political Killings in Kosova/Kosovo, March-June 1999. Washington DC: American Bar Association Central and East Euroepan Law Initiative.
Anderson, Margo i Stephen E. Fienberg. 2001a. Who Counts? Census-Taking in Contemporary America. Revidirano izdanje u mekom povezu. New York: Russel Sage Foundation.
Anderson, Margo i Stephen E. Fienberg. 2001b. Counting and estimation: Methodology for Improving the Quality of Censuses. The U.S. 2000 Census Adjustment Decision. Izlaganje odrano na International Conference on Quality in Official Statistics, Stockholm, Švedska, 14.-15. maj, 2001.
Asher, Jana i Patrick Ball. 2001. Understanding Human Rights Violation Data through the Analysis of Circuits. Predat za objavljivanje u Proceedings of the American Statistical Association (Government Statistics Section).
Asher, Jana i Stephen E. Fieberg. 2001. Statistical Variations on an Administrative Records Census. Predat za objavljivanje u Proceedings of the American Statistical Association (Government Statistics Section).
Ball, Patrick. 2000a. Policy or Panic: The Flight of Ethnic Albanians from Kosovo, March-May 1999. Washington D.C.: American Association for the Advancement of Science.
Ball, Patrick. 2000b. The Guatemalan Commission for Historical Clarification: Intersample Analysis. Poglavlje 11 u Making the Case: Investigating Large Scale Human Rights Violations using Information Systems and Data Analysis, urednici Patrick Ball, Herbert Spirer i Louise Spirer. Washington, DC: American Association for the Advancement of Science.
Belin, Thomas R. i Donald B. Rubin. 1995. A Method for Calibrating False-Match Rates in Record Linkage. Journal of the American Statistical Association.
Bishop, Yvonne M.M., Stephen E. Fienberg i Paul H. Holland. 1975. Discrete Multivariate Analysis: Theory and Practice. Cambridge, MA: MIT Press.
Converse, N. i F. Scheuren. 2001. Workarounds in Survey Data Handling. Predat za objavljivanje u New Journal of Data.
Cressie, Noel i Paul W. Holland. 1983. Characterizing the Manifest Probabilities of Latent Trait Models. Psychometrika 48: 129-141.
Cormack, R. 1992. Interval Estimates for Mark-Recapture Studies of Closed Population. Biometrics 48: 567-576.
Cowan, Charles Douglas. 1984. The effects of misclassifications on estimates from capture-recapture studies. Doktorska disertacija, George Washington University.
Darroch, John N., Stephen E. Fienberg, Gary Glonek, FV. Gary i Brian W. Junker. 1993. A Three-Sample Multiple-Recapture Approach to Census Population Estimation with Heterogeneous Catchability. Journal of the American Statistical Association 88: 1137-1148.
Fienberg, Stephen E. 1972. The multiple recapture census for closed populations and incomplete 2k contingency tables. Biometrika 59: 591-603.
Fienberg, Stephen E. 1980. The Analysis of Cross-Classified Categorical Data. Drugo izdanje. Cambridge, MA: MIT Press.
Fienberg, Stephen E., Matthew S. Johnson i Brian W. Junker. 1999. Classical multilevel and Bayesian approaches to population size estimation using multiple lists. Journal of the Royal Statistical Society, Series A 162: 383-405.
Fienberg, Stephen E. i Michael M. Meyer. 1983. Loglinear models and categorical data analysis with psychometric and econometric applications. Journal of Econometrics 22: 191-214.
Ford, B. 1983. Hot Deck Imputation. Pogl. 14. u sv. 2, deo 4, Incomplete Data in Sample Surveys, uredili William G. Madow, Harold Nisselson i Ingram Olkin. New York: Academic Press.
Hogan, Howard. 1993. The 1990 Post-Enumeration Survey: Operations and Results. Journal of the American Statistical Association 88: 1047-1060.
Holland, Paul W. 1990. On the sampling theory foundations of item response theory models. Psychometrika 55: 577-601.
Human Rights Watch. 2001. Under Orders: War Crimes in Kosovo. New York: Human Rights Watch.
Independent International Commission on Kosovo. 2000. The Kosovo Report: Conflict*International Response*Lessons Learned. New York: Oxford University Press.
International Working Group for Disease Monitoring and Forecasting. 1995a. Capture-recapture and multiple-record systems estimation, I: History and theoretical development. American Journal of Epidemiology 141: 1047-1058.
International Working Group for Disease Monitoring and Forecasting. 1995b. Capture-recapture and multiple-record systems estimation, II: Applications in human diseases. American Journal of Epidemiology 141: 1059-1088.
Marks, E. S., W. Seltzer i K. J. Krótki. 1974. Population Growth Estimation: A Handbook of Vital Statistics Measurement. New York: The Population Council.
Oh, H. i F. Scheuren. 1983. Weighting Adjustment for Unit Nonresponse. Pogl. 13 u sv. 2, deo 4, Incomplete Data in Sample Surveys, uredili William G. Madow, Harold Nisselson i Ingram Olkin. New York: Academic Press.
Organization for Security and Cooperation in Europe. 1999. Kosovo/Kosova As Seen As Told: An Analysis of the Human Rights Findings of the OSCE Kosovo Verification Mission October 1998 to June 1999. Varava, Poljska: OSCE Office for Democratic Institutions and Human Rights.
Peterson C. G. J. 1896. The yearly immigration of young plaice into the Limfjord from the German Sea. Report of the Danish Biological Station to the Ministry of Fisheries 6: 1-48.
Physicians for Human Rights. 1999. War Crimes in Kosovo: A Population-Based Assessment of Human Rights Violations of Kosovar Albanians by Serb Forces. Boston: Physicians for Human Rights.
Record Linkage Techniques. 1985. Record Linkage Techniques - 1985 Proceedings of the Workshop on Exact Matching Methodologies. Washington, DC: U.S. Internal Revenue Service, Statistics of Income Division.
Record Linkage Techniques. 1997. Record Linkage Techniques - 1997 Proceedings of An International Workshop and Exposition. Washington DC: Ernst and Young, LLP.
Rubin, Donald B. 1987. Multiple imputation for nonresponse in surveys. New York: Wiley.
Scheuren, F. 1985. Methodologic issues in linkage of multiple data bases. Record Linkage Techniques - 1985 Proceedings of the Workshop on Exact Matching Methodologies. Washington, DC: U.S. Internal Revenue Service, Statistics of Income Division.
Sekar, C. C. i Deming, W. E. 1949. On a Method of Estimating Birth and Death Rates and the Extent of Registration. Journal of the American Statistical Association. 44:101-115.
Spiegel, Paul B. i Peter Salama. 2000. War and Mortality in Kosovo, 1998-1999: An Epidemiological Testimony. Lancet 355: 2206-2211.
Splus, Insightful Corporation. 2001. "Generalizing the Linear Model". Pogl. 12 u S-PLUS for Windows Guide to Statistics, Volume 1. Seattle, WA: Insightful Corp.
Stata Corporation. 2001. Section on generalized linear models in Stata 7 Reference Manual. Vol 1 A-G. College Station, TX: Stata Corporation.
Ovog izvetaja ne bi bilo bez saradnje mnogih pojedinaca i organizacija. On se zasniva prvenstveno na podacima koje je obezbedila Srednjo- i istočnoevropska pravna inicijativa Američke advokatske komore (ABA/CEELI), Američko udruenje za naučni napredak (AAAS), Centar za mir kroz pravdu, Odbor za odbranu ljudskih prava i sloboda, Human Rights Watch, Organizacija za evropsku bezbednost i saradnju, te Međunarodni krivični sud za bivu Jugoslaviju. Veoma smo zahvalni ovim organizacijama to su bile spremne da međusobno podele rezultate svoga rada. Bez ovog saradničkog duha, ovaj projekat ne bi bio moguć. Scott Carlson, direktor Programa za srednju i istočnu Evropu pri ABA/CEELI, 1999. godine okupio je organizacije za ljudska prava kako bi podelili informacije u vezi sa Kosovom i iskoristili njihova prethodna iskustva u dokumentovanju krenja ljudskih prava. ABA/CEELI i AAAS su 2000. objavili izvetaj pod naslovom Politička ubistva na Kosovu/Kosova, mart-jun 1999. U aprilu 1999, Patrick Ball i Fritz Scheuren iz AAAS-a, zajedno sa Fronom Nazijem iz Instituta za istočno-zapadni menadment i Instituta za političke i pravne studije započeli su istraivanje o statističkim obrascima kretanja izbeglica sa Kosova. Ovaj rad objavljen je pod naslovom Politika ili panika: bekstvo etničkih Albanaca sa Kosova, mart-maj 1999. Među organizacijama i pojedincima koji su ulo`ili svoje vreme, obezbedili podatke i druge oblike pomoći ovim ranijim projektima su Lekari za ljudska prava, Centar za ljudska prava i Odsek za demografiju, University California-Berkley, Fred Abrahams, Vasian Cepa, Blerina Kashari, Julia Belanger, Andrea Lako, Eric Stover, dr. Sandra Eyster, Ilir Gocaj i mnogi drugi. Pored toga, brojni pojedinci velikoduno su doprineli ovom projektu svojim vremenom, energijom i stručnoću. Matt Zimmerman izradio je softversku aplikaciju za vrenje intersistemskog sravnjivanja. Takođe je dizajnirao prelom i pruio značajnu pomoć kod grafičkog dizajna i tehničkog uređivanja. Patricia Hawkins pomogla je pri početnim fazama programiranja. Sara Churchill i Maya Goldstein nadgledale su kodiranje podataka ABA-e i OEBS-a. Jason Sanders pomogao je kod kodiranja i administrativnih problema. Jeff Henigson je ponovo kodirao HRW podatke iz prvobitnih razgovora. Biro za demokratiju, ljudska prava i rad američkog State Departmenta i američke Agencije za međunarodni razvoj dao je podrku organizaciji ABA/CEELI. Podrka američke Vlade bila je od sutinske va`nosti za projekat, ali valja naglasiti da osoblje američke Vlade ni u jednom momentu nije pokualo da se mea u nae nezavisno vođenje projekta ili da utiče na nae samostalno izvetavanje. ABA/CEELI strukturirala je svoje odnose sa američkom Vladom kao "saradnički sporazum" da bi u tom smislu osigurala svoju nezavisnost. Stoga ovaj izvetaj nije podnet američkoj Vladi na reviziju i svaka saglasnost sa stavovima američke Vlade potpuno je slučajna. Pored podrke preko podugovora sa ABA/CEELI, AAAS je dobio podrku od Instituta za gra|ansko drutvo i Fondacije Johna D. i Catherine T. MacArthur.
Patrick Ball programirao je bazu podataka, vodio kontrolu kvaliteta i izradio statistički softver, napisao delove svakog odeljka u izvetaju i dao opti orijentacioni okvir. Wendy Betts napisala je glavni deo izvetaja i koordinirala kodiranje podataka ABA/CEELI i OEBS-a. Fritz Scheuren pruio je statističko vođstvo i napisao Dodatak 1. Jana Dudukovic organizovala je radnike koji su obrađivali podatke, nadgledala proces sravnjivanja, kodirala podatke o OVK i doprinela Dodatku 1. Jana Asher programirala je statističke rutine i napisala Dodatak 2. Patrick Ball i Jana Asher razvili su procedure modeliranja. Svi autori zajednički su uredili izvetaj.
Mnogo je ljudi radilo na recenziji ovog izvetaja. Međunarodnim timom za recenziju predsedavala je dr Helge Brunborg (vii naučni saradnik, Statistics Norway), a tim su činili dr Ronald Lee (redovni profesor ekonomije i demografije, University of California-Berkeley); dr Francoise Seillier-Moiseiwitsch (vanredni profesor statistike, direktor Centra za bioinformatička istraivanja, University of Maryland-Baltimore County i predsednik Komiteta za ljudska prava, Američko udruenje za statistiku); dr Jean-Louis Bodin (bivi predsednik Međunarodnog instituta za statistiku); dr Carlo Malaguerra (generalni direktor Saveznog zavoda za statistiku [vajcarske - SFSO); dr Philippe Eichenberger (ef Odseka za statističke metode - SFSO); dr Beat Hulliger (zamenik efa Odseka za statističke metode - SFSO). Recenzenti su dali opsene komentare na dva preliminarna nacrta izvetaja. Sa nama su radili na manje formalnoj osnovi brojni dodatni recenzenti. Među njima su bili dr. David Banks (Ministarstvo transporta SAD), Herbert F. Spirer (vanredni profesor, Program za ljudska prava na Columbia University School of International and Public Affairs); Louise Spirer (samostalni istraivač) i dr Denise Albanese (Odsek za engleski jezik, George Mason University). Ovaj je izvetaj usavren zahvaljujući otvorenim kritičkim sudovima koje su izrazili recenzenti i smo im stoga zahvalni. Naravno, autori su isključivo odgovorni za analize i miljenja izraena u ovoj studiji.
AAAS-ov Program za nauku i ljudska prava
Program za nauku i ljudska prava Američkog udruenja za naučni napredak (AAAS) nastoji da zatiti ljudska prava naučnika i da unese naučne metode u rad na području ljudskih prava. U sklopu ovog programa razvijaju se i unapređuju metode za dokumentovanje i praćenje ljudskih prava, jača podrka ljudskim pravima među naučnicima i sprovode istraivanja o različitim pitanjima vezanim za ljudska prava. Rad Programa zasniva se na pretpostavci da je potovanje ljudskih prava od bitne vanosti za naučna istra`ivanja i primenu nauke. Vie informacija o Programu i njegovim aktivnostima naći ćete na stranici: http://shr.aaas.org.
Srednjo- i istočnoevropska pravna inicijativa Američke advokatske komore
Srednjo- i istočnoevropska pravna inicijativa je projekat u javnom sektoru Američke advokatske komore (ABA). Projekat ima za cilj unapređenje vladavine prava kroz podrku procesu pravne reforme koji se sprovodi u srednjoj i istočnoj Evropi i novim nezavisnim dravama biveg Sovjetskog Saveza (NND). Kroz različite programe, CEELI prua stručnu pravnu pomo} američkih i evropskih volontera koji pomau demokratijama u nastajanju da modifikuju ili prestrukturiraju svoje zakone i pravne sisteme. ABA/CEELI Projekat za dokumentovanje ratnih zločina (War Crimes Documentation Project - WCDP) počeo je sa radom u maju 1999. uz finansiranje od strane Američke agencije za međunarodni razvoj i američkog State Departmenta. WDCP ima dva cilja: 1) pomoć naporima u istrazi ratnih zločina i krivičnom gonjenju počinilaca i 2) podizanje nivoa javne svesti o ratnim zločinima, njihovom krivičnom gonjenju i ulozi Međunarodnog krivičnog suda za bivu Jugoslaviju (MKSJ) u ovom procesu. U vezi sa pitanjima ratnih zločina, ABA/CEELI blisko je sarađivao sa nekoliko drugih nevladinih organizacija, uključujući Koaliciju za međunarodnu pravdu (Coalition for International Justice - CIJ), Chicago-Kent College of Law, te Centar za mir kroz pravdu. Dalje informacije o ABA/CEELI i njegovim aktivnostima naćićete na stranici http://www.abanet.org/ceeli/.
Dr Patrick Ball je zamenik direktora AAAS-ovog Programa za nauku i ljudska prava. Od 1991. projektovao je sisteme za upravljanje informacijama i sprovodio kvantitativnu analizu za opse`ne projekte o ljudskim pravima za komisije za utvrđivanje istine, nevladine organizacije, tribunale i misije Ujedinjenih nacija u El Salvadoru, Etiopiji, Gvatemali, Haitiju, Junoj Africi, Kosovu i Šri Lanci. Mr Wendy Betts je kodirektor ABA/CEELI Projekta za dokumentovanje ratnih zločina. Dala je svoj doprinos brojnim publikacijama o međunarodnim i unutarnjim sukobima i tranziciji posle sukoba. Dr Fritz Scheuren je potpretsednik Odseka za statistiku u Nacionalnom centru za istraivanje javnog mnijenja, istraivačkog ogranka Univerziteta u Chicagu. Ima veliko iskustvo na području povezivanja zapisa, kako u istraivačkom tako i u administrativnom okruenju. Trenutno sve svoje vreme posvećuje problemima američkih Indijanaca.
Jana Dudukovic je nezavisni istraivač i studira pod mentorstvom Louise Spirer.
Mr Jana Asher ima veliko istraivačko iskustvo u procenama malih područja, administrativnim zapisima, povezivanju zapisa i proceni viestrukih sistema. Trenutno radi doktorat u oblasti statistike na Univerzitetu Carnegie Melon pod vođstvom prof. Stephena E. Fienberga.
[1] Podaci o kretanju izbeglica prvenstveno su zasnovani na evidenciji koju je vodila pogranična policija albanske Vlade. Dodatni administrativni arhivi Visokog komesarijata za izbeglice UN i albanske Vlade, kao i podaci iz pregleda nekoliko organizacija za ljudska prava upotpunili su analizu pogranične evidencije. Valja istaknuti da ova analiza ne uključuje podatke o raseljenim licima unutar zemlje, koja nisu nikad prela granicu. Stoga ove procene ne pretstavljaju ukupan broj ljudi koji su napustili domove. Vidi Ball (2000). [2] Direktni rezultati prikazani su u Dodatku 2. [3] U nastojanju da se osigura kvalitet, celokupno kodiranje podataka koje uključuje pore|enja izvora podataka nezavisno su izvrila dva lica; njihovi su rezultati upoređeni, a sve razlike pregledao je i uskladio jedan od autora studije. [4] Celokupno statističko programiranje vezano za procenu rezultata nezavisno su izvrila dva analitičara, koji su koristili različite računare i različit softver, a njihovi rezultati bili su istovetni. [5] Iako analiza ubistava pokriva period od 20. marta do 22. juna, analiza kretanja izbeglica zavrava se krajem maja, i to iz dva razloga. Kao prvo, evidenciji koju je vodila albanska pogranična policija zavrena je u to vreme. Kao drugo, priče govore da je bilo vrlo malo kretanja preko granice nakon tog vremena; to je kasnije potvrđeno istraivanjima koja su sprovedena među stanovnicima izbegličkih logora od sredine do kraja juna. [6] Vidi Ball 2000. Tri faze odraavaju obrazac prema kojem su izbeglice naputale svoje domove, a ne obrazac prelaska granice. Za bilo koji dan vredi da je neto vie od polovine izbeglica koji su preli granicu napustilo svoje domove ranije toga dana. Međutim, ostale izbeglice koje su tog dana prele granicu putovale su du`e. Analiza podataka objasniće uzroke kasnijeg prelaska. [7] Period od marta do juna za svrhu ove analize sa`et je u dvodnevne intervale. Sa`imanje vremena do ovog nivoa pruilo je dovoljno podataka za svaki interval da se statistička analiza stabilizuje; vidi Dodatak 2. Vrednost procenjenog broja ubistava ili izbeglica projektovana za dati vremenski trenutak na vodoravnoj osi grafikona pretstavlja broj za dotični dvodnevni period. [8] Za puni opis ovog procesa vidi Dodatak 1. [9] Za puni opis ove procedure vidi Dodatak 2. [10] Vidi ABA/AAAS (2000), PHR (1999), Spiegel i Salama (2000). [11] Postoji jedna vrednost koja predstavlja anomaliju u junom regionu (Slika 5) krajem maja. Procena o vie od 200 ubijenih ljudi u jednom dvodnevnom periodu rezultat je manje od 20 dokumentovanih ubistava. Naravno, ova vrednost takođe ima relativno visok nivo greke, kao to je pokazano u Dodatku 2, Slika 12. Kao to se iz slike vidi, većina vrednosti ima ni`i nivo greke koji ne umanjuje interpretaciju obrasca. Međutim, ova vrednost ima dovoljno iroku marginu greke pa je moguće da se značajno ne razlikuje od nule. [12] Za ovu analizu koristili smo samo broj prijavljenih ubistava, a ne procenjeni ukupni broj. Podaci nisu prikladni za procenu na optinskom nivou. Vidi Odeljak 5.3 za analizu pri kojoj je korićen procenjen broj ubistava na regionalnom nivou. [13] Saetak izvora naveden je u Dodatku 3. [14] Jugoslovenska vlada bila je glavni zagovornik teze da su vazduni udari NATO-a odgovorni za ubistva i kretanje izbeglica na Kosovu. Stoga, najjači test ove hipoteze je korićenje podataka same jugoslovenske vlade o tome kada i gde su napadi izvedeni. [15] Brifing Ministarstva odbrane Velike Britanije, zamenik načelnika taba odbrane, Sir John Day; dostupno na Internet stranici: http://www.kosovo.mod.uk/brief040499.htm od 3. januara 2001. [16] Vidi Dodatak 2 za detaljniju raspravu, uključujući analizu regresije. [17] Za detaljniju raspravu vidi Dodatak 2, Sliku 21. Ostale tačke gde procene i ostaci odstupaju javljaju se kada je kretanje blizu nule te stoga nisu značajne. [18] ABC News preneo je izjavu jugoslovenske vlade u kojoj se navodi "[u] čast najvećeg hrićanskog praznika, Uskrsa, sve aktivnosti vojske i policije na Kosovu usmerene protiv terorističke organizacije Oslobodilačke vojske Kosova (OVK) prekinuće se 6. aprila u 20 časova [15 h po istočnom vremenu]". Pravoslavni Uskrs bio je u nedelju, 11. aprila 1999. Vidi http://abcnews.go.com/sections/world/DailyNews/kosovo_bombing990406.html od 3. januara 2002. [19] Bili su dostupni podaci o dodatnih 18.000 anonimnih smrtnih slučajeva, ali nisu uvrteni usled nedostatka vremena. [20] Engleski termini "last name" i "surname" korićeni su u značenju "prezimena". [21] Rezultati analize osetljivosti navedeni su u Dodatku 2. Zaključili smo da je sutinska interpretacija podataka robusna u odnosu na preostalu nepreciznost u datumima nastalu usled pogreke u saoptavanju ili nedostajućih podataka. [22] Ekshumacioni podaci pruili su osnovni rani referentni okvir za probleme sravnjivanja na koje ćemo docnije naići. U početku smo smatrali da su imena u ekshumacionim podacima jedinstvena. Na kraju, iako se to pokazalo netačnim, ekshumacioni podaci jo uvek su bili najbolji registar za identifikaciju rtava po imenu. [23] Procenti ukupno ne iznose 100% zbog zaokruivanja. [24] Vidi www.reliefweb.int/hcic/ od 10. oktobra 2001. Valja primetiti da lista HCIC-a uključuje optinu Malievo /Malishevë/ koja nije postojala tokom prve tre četvrtine 1999. Tokom konflikta, Malievo je bilo deo druge četiri optine. [25] Vidi NIMA GEOnet Names Server (GNS) na Internet-stranici http://gnpswww.nima.mil/geonames/GNS/index.jsp od 3. januara 2002. [26] Interesantno je da smo nali vie od 50 lokacija na listi NIMA-e za koje su geografska irina i duina bile 25 ili vie kilometara udaljene od njihove pozicije na vie karata. U takvom slučaju, naom proverom kvadrata na mrei kojom su upoređivane pozicije geografske irine i duine u odnosu na mrene koordinate na kartama HCIC-a, odbačene koordinate NIMA-e. [27] Koristili smo Haversineovu formulu za računanje udaljenosti; vidi, npr. http://mathforum.org/dr.math/problems/longandlat.html. [28] I udaljenije lokacije povremeno su tretirane kao iste; to se deavalo kad su veoma udaljena mesta nosila ista imena te su ih mo`da pobrkali ili svedoci ili kodifikatori podataka. Vidi Odeljak 5.4. za detalje. [29] Jedan recenzent je primetio da se neka imena mogu dati licima obaju polova. Budući da je pol igrao relativno malu ulogu u naem principu utvrđivanja podudarnosti, to pravilo uređivanja nije moglo značajno da utiče na sravnjivanje. [30] Za neke od resursa koje smo koristili, vidi http://www.kabalarians.com/male/serb-m.htm i http://toybo.flick.com/onomastikon/Europe-Eastern/Former-Yugoslavia/Serbia/Surnames.htm. [31] Logično, isto tako mala frakcija anonimnih smrtnih slučajeva bili bi Srbi. Ovi brojevi su premali da bi uticali na interpretaciju naih procena. Stoga smo ignorisali njihovo dejstvo. [32] Kao to je već pomenuto, u Dodatku 2 ispituje se robusnost u odnosu na poznate slabe tačke izvetavanja o datumima. [33] U ovom krugu nisu proveravani duplikati u ekshumacionih podataka jer se pretpostavljalo da su zapisi jedinstveni. U Odeljku 5 opisujemo kako je ova pretpostavka docnije izmenjena jer je utvr|eno da su neka imena bila dvostruko zabeleena. [34] Jedan od autora ove studije koorganizovao je dve konferencije o povezivanju arhivskih zapisa (1985. i 1997. godine) koje daju pristup ovoj bogatoj literaturi. [35] Vidi Scheuren (npr. 1985) za dalje informacije o statističkim svojstvima metoda viestrukog svrstavanja u blokove. [36] Upotreba termina "krug" u Asher i Ball (2001) je različita, ali su analitički problemi slični. [37] Vidi Dodatak 2 za upotrebu ove informacije u analizi osetljivosti. [38] Pojedinačne odluke kodifikatora sačuvane su za analizu osetljivosti. [39] Kao to je drugde rečeno, kada su greke bile neizbene, izabrali smo da greimo tako da broj ubistava bude manji. [40] Aplikacija za sravnjivanje bila je klijent HTML-a kojem su kodifikatori pristupali preko internetskih “browsera”. Sama aplikacija napisana je u PHP-u i MySQL-u na lokalnoj mrei. Podaci su obrađivani pomoću Pythona i SQL-a, a statistike i grafikoni pravljeni su pomoću programa Stata. Grafikoni su uređeni u Adobe Illustratoru i tekstualnom programu za pripremu za tampanje pomoću LATEX2e. [41] Dodatni datumi korićeni su za procenu preciznosti datuma. Vidi Dodatak 2. [42] Kao to je ranije pomenuto, bili su dostupni zapisi o dodatnih 18.000 grupnih smrtnih slučajeva, ali usled nedostatka resursa nisu obrađeni. [43] Ispustiti zapis znači dodati ga krugu podudarnih zapisa u samosravnjivanju. Na taj način, informacije sadrane u "isputenom" zapisu jo su dostupne u "zadranom" zapisu. [44] "Hot decking" (npr. Ford 1983) procedurom unose se nedostajuće informacije u neki zapis tako da se pronađe drugi zapis – "donatorski" zapis koji sadri takve informacije, a koji je u drugim aspektima istovetan ili gotovo istovetan. Ovde smo za izbor donatora koristili geografsku blizinu. Da bismo smanjili Monte Carlo greku koju izaziva imputovanje informacija, najpre smo izradili potencijalne "donatorske" grupe od po 60 zapisa (u 85% sela za koja je utvrđeno da su bila poprita jednog ili vie ubistava nali smo 60 ili vie valjanih dostupnih zapisa u krugu od 10 km). [45] I ovde su u svrhu smanjivanja pogreke usled imputovanja podataka datumi tri puta imputovani u zapise, pri čemu je svakom tako nastalom zapisu pripisana teina od 0.33. Motivacija za ovu upotrebu viestrukog imputovanja je izloena u Oh i Scheuren (1983). Nismo koristili viestruko imputovanje u smislu u kojem ga opisuje Rubin (1987). Posebno, na cilj nije bio da izračunamo varijante. Preostala nesigurnost koja nastaje usled procesa imputovanja je zacelo mala (vidi, npr. Converse i Scheuren 2001). Ipak, postoji izvesna mogućnost preostale pristrasnosti, pa se činilo opravdanim preduzeti analize osetljivosti (Dodatak 2). Stoga smo takođe opisali sva testiranja signifikantnosti i intervale pouzdanosti izračunate u Dodatku 2, te smo ih uključili u izvetaj kao "nominalne". [46] Kod uobičajenih greaka u pisanju imena i prezimena, lista je uređena tako da su zapisi sa uobičajenim varijantama bili smeteni jedan pored drugog. [47] Žrtve sa imputovanim datumima neproporcionalno su prikazane u ćelijama sa manje podudarnih zapisa. Zapisi koji su imali vie podudarnih parova imali su i vie mogućnosti da dobiju informaciju o datumu, dok su zapisi sa manje podudarnosti imali manje mogućnosti za dobijanje takve informacije. Zbog načina na koji su imputacije izvedene, neki su zapisi dobili razlomačke vrednosti koje su zbrojene na slici. Rezultati su zaokrueni na najblii ceo broj. Na primer, "da-da-ne-ne" ćelija tako je zaokruena sa 176,66 na 177. Ukupan iznos odraava zaokruenu brojnost. [48] Za proveru kvaliteta procesa procene koji je zahtevala ova studija, softverske rutine za sve procedure procene o kojima je raspravljano u Dodatku 1, nezavisno su izradili Jana Asher, koja je koristila Splus 2000 i SAS Version 8, i Patrick Ball, koji je koristio Stata 7. Rezultati su uređeni, a tamo gde su se pojavile razlike, rutine su debagovane, sve dok nisu postignuti podudarni rezultati. [49] Direktni intervali nii su nego to bi bili da smo imali vremena do obradimo 18.000 anonimnih rtava navedenih u razgovorima koje je ABA provela izvan Kosova, a koje nismo mogli da upotrebimo. Da smo mogli da uključimo ove dodatne zapise, direktno primetljive donje granice bi se povećale, to bi ih pribliilo modelskoj proceni koju smo izabrali. [50] Kada je ukupan zbir grupnih podataka bio manji od ukupnog zbira pojedinačnih podataka, relativna razlika je definisana kao nula. [51] U loglinearnom modeliranju, procena standardnih greaka pretpostavlja da podaci ne nedostaju, nema gomilanja izvetaja niti greaka u sparivanju. Međutim, očekuje se da relativne duine intervala pouzdanosti od procena alternativnih loglineranih modela budu robusne u pogledu malih smetnji koje uzrokuju ovi nedostaci u podacima. Ipak, kako je izračunato prema modelu, sami intervali pouzdanosti su prekratki. Po naem miljenju, to ograničenje nije dovoljno da dovede do pogrenog zaključka. [52] Ovde je upotrebljena reč "nominalan" jer koeficijent pouzdanosti treba da bude ispravljen kod vrenja viestrukih poređenja. Bonferronijeve korekcije, iako uglavnom konzervativne, mogu da budu jedan od pristupa. Nadalje, često smo vizuelno i verbalno upoređivali dve procene ili dva niza procena bez opaski o eventualnim neizmerenim kovarijantama. [53] U slučaju procene viestrukih sistema, broj ćelija u unakrsnoj klasifikacijskoj tabeli iznosi 2J-1, gde je J broj lista; x000 ćelija se smatra "strukturnom nulom" i stoga nije uključena u proračun stepeni slobode. [54] Ovde je vana struktura podataka, a ne njihova sadrina. Stoga su regije označene brojevima. Severna regija je regija 1; istočna regija je regija 2; juna regija je označena brojem 3, a zapadna brojem 4. [55] Termin "globalan" koristiće se u nastavku ovog Dodatka, a označavaće ukupan broj ubistava na Kosovu u periodu od marta do juna 1999. 56 Ako se u modeliranje uključi svih 16 estodnevnih tačaka, rezultirajuće procene su "ravne" (istovetne) za est poslednjih vremenskih tačaka.
57 10.356 je golbalna procena broja ubistava; nelogično je verovati da bi bilo koja procena za jednu prostorno-vremensku tačku bila ve}a od ovog broja. 58 Za daljnje informacije o rezultatima strategije nabrajanjem, nasuprot rezultatima istraivačke strategije prikupljanja podataka, vidi Asher i Ball (2001).
|