Picture of Dajana Osmani
Pitanje u vezi sa zadatkom 7a sa vežbi
by Dajana Osmani - Sunday, 12 April 2020, 07:56 PM
 
Dragi profesore,

U zadatku 7a se od nas traži da, koristeći se formulom logističkog regresionog modela, uporedimo šanse dvaju ispitanika da njihov odgovor na binarnoj kriterijumskog varijabli bude 1.Ti ispitanici imaju identične skorove na 2 od 3 prediktorske varijable, ali se razlikuju po skoru na trećoj varijabli. Ta varijabla na kojoj se razlikuju je pol, koji je u bazi podataka na koju se odnosi zadatak označen tako da ženski pol ima vrednost 2, a muški 1 (ovo naglašavam zato što je to u zadatku, tamo gde sam na priloženoj slici to nevešto označila, pogrešno napisano).

Kao što je to u rešenjima lepo objašnjeno, mi dobijamo različitu vrednost šansi za ta dva ispitanika. Na osnovu toga zaključujemo da je za ispitanicu veća šansa da ima odgovor 1 na kriterijumskog varijabli od muškog ispitanika. Međutim, logično je da je krajnji proizvod dobijen iz te formule veći (pa samim tim i šanse) kad je vrednost ženskog pola 2, a muškog 1.

Dakle, jedino što me zbunjuje u vezi sa ovim zadatkom jeste praktična relevantnost numeričkog poređenja ovakvih ispitanika koji se razlikuju isključivo prema polu, s obzirom na to da je odabir vrednosti na varijabli pol proizvoljan, odnosno mogli bismo da dodelimo kategorijama pola suprotne vrednosti i da dobijemo suprotan zaključak. Čini mi se da bi zadatak bio smisleniji ukoliko bismo poredili ispitanike koji se razlikuju po vrednostima neke od varijabli na kojoj vrednosti nisu ''arbitrarne'' odnosno na kojima porast u vrednostima zaista znači i porast u prisustvu neke osobine. Da li sam ja propustila smisao ovog zadatka, ili zaista ne bismo smeli na osnovu šansi izračunatih za ova dva ispitanika da zaključujemo da neki od njih ima veću ili manju šansu da pripada nekoj vrednosti na kriterijumu?

Hvala unapred!

(Edited by Лазар Тењовић - original submission Sunday, 12 April 2020, 03:56 AM)


Picture of Лазар Тењовић
Re: Pitanje u vezi sa zadatkom 7a sa vežbi
by Лазар Тењовић - Friday, 26 March 2021, 10:05 PM
 
Hvala Dajana na pitanju i što ste uočili ovu greškicu u oznaci u rešenju zadatka...U međuvremenu je ova greščica ispravljena.
Žao mi je za ovu grešku u oznaci, da žene su 2 a muškarci 1 i posle je korišćeno 2 za žene a 1 za muškarce u računu. Ako pol ima veze sa šansama da se bude u kategoriji 1 binarne kriterijumske varijable, rekao bih da ima smisla da ga uključimo bez obzira što su oznake arbitrarne. To kako su označene kategorije imaće veze sa logističkim koeficijentom: ako muškarci imaju manje šanse (da budu u kategoriji 1 kriterijumske varijable) no žene a označeni su manjom cifrom logistički koeficijent će biti pozitivan jer su žene označene većom cifrom a imaju veće šanse da budu u kategoriji 1 krit. varijable. A ako zamenite oznake na polu (muškarci i dalje imaju manje šanse a imaju tada veću oznaku na polu) onda će predznak logističkog koeficijenta biti negativan. I to je u redu, to i dalje znači da muškarci imaju manje a žene veće šanse . Dakle, biće na kraju isti ishod u smislu da će pol doprineti predikciji na isti način, u smislu ako ste muško imaćete manje šanse da budete u kategoriji 1, pod uslovom da ostale varijable u modelu držite konstantnim. Dakle, ne vidim šta bi tu smetala arbitrarnost oznaka, bitno je da mi vidimo kako pol utiče znajući kako smo označili koju kategoriju.
Nadam se da sam bio jasan...ako nisam pišite...