Cercetare de piata; s agr; rgazdas; gban Biblioteca de manuale digitale

După primirea și verificarea chestionarelor, codificarea și înregistrarea datelor sunt următorul pas în procesare.

Datele chestionarelor sunt înregistrate într-un tabel, ale cărui rânduri corespund chestionarelor, iar coloanele conțin codul fiecărui răspuns. Primul rând al tabelului este folosit pentru a identifica coloanele, aici scriem nume de variabile (identificatori). Atunci când alegeți ID-urile, este recomandabil (dar nu obligatoriu) să respectați următoarele reguli:

Începeți cu o literă de identificare și conțineți doar o literă sau un număr. Fără spații sau caractere speciale (%, a, #, =, ...).

ID-ul trebuie să aibă maximum opt caractere.

Identificatorul ar trebui să se refere pe scurt la întrebarea pe care o folosim pentru a codifica.

Un ID poate apărea o singură dată într-un tabel.

În cazul încălcării regulilor de mai sus, cel mai probabil nu vom putea transfera corect datele noastre înregistrate către alte programe, de ex. pachete software statistice.

În cele ce urmează, vom analiza codificarea răspunsurilor pentru fiecare tip de întrebare. Codificarea poate fi, desigur, rezolvată în multe moduri, aici vă prezentăm o posibilă versiune simplă.

5.2.1 Codificarea întrebărilor închise

Variabilă nominală, un singur răspuns este acceptabil

În Figura 11, pentru ultimul tip de întrebare, instrucțiunea de codare trebuie să specifice modul în care numărul secvenței de răspuns este utilizat pentru codare: de sus în jos sau de la stânga la dreapta. Acest lucru este valabil mai ales dacă înregistrarea datelor este efectuată de mai multe persoane, deoarece din fișierul înregistrat nu este clar ce sistem a folosit înregistratorul de date fără o comparație cu chestionarele. Dacă, în faza de proiectare a chestionarului, considerăm că numerele de serie scrise pe chestionar nu afectează respondentul, atunci cel mai simplu mod este să introduceți numărul de serie în întrebare. Acest lucru este important mai ales dacă numărul de răspunsuri posibile este mare: 6-8 sau mai mult. În acest caz, ar încetini semnificativ înregistrarea datelor, dacă ar fi întotdeauna necesar să se numere câte răspunsuri a marcat respondentul (până la aproximativ 5 răspunsuri posibile, acest lucru poate fi decis dintr-o privire).

Figura 11 - Întrebarea nominală (categorică) - poate fi acceptat un singur răspuns

Aceste tipuri de întrebări pot fi codate prin specificarea numărului de ordine al răspunsului marcat („bifat”).

Identificatorul posibil al primei întrebări este MELYHUT, codul de răspuns este 2.

Identificatorul posibil pentru a doua întrebare este KOSTOL, codul de răspuns este 1.

Identificatorul posibil al celei de-a treia întrebări este TICKET, codul de răspuns este 3.

Identificatorul posibil pentru a patra întrebare este IZESITES, codul de răspuns este 5.

Figura 12 - Versiune numerotată mai ușoară cu numere de serie (întrebare nominală)

Trebuie menționat faptul că firmele de cercetare de piață pregătesc adesea chestionarul cu valoarea codului tuturor întrebărilor preimprimate pe chestionar conform exemplului de mai sus. Această practică facilitează, fără îndoială, înregistrarea datelor, dar afectează semnificativ lizibilitatea și claritatea chestionarelor. Când lucrați cu intervievatorii, aceasta nu este o problemă pentru respondenți, dar în cazul unui chestionar autoadministrat, acest instrument ar trebui să fie utilizat cu mare atenție (un chestionar complicat, aglomerat afectează disponibilitatea de a răspunde).

Rețineți că întrebările da/nu și da/nu sunt de obicei codificate după cum urmează:

1 = da, da 0 = nu, nu.

Aceasta este, de asemenea, o soluție corectă și naturală, dar trebuie avut grijă să nu interferați cu practicile de înregistrare a datelor într-un singur loc de muncă.

Variabilă nominală, răspunsuri multiple sunt acceptabile

Figura 13 - Întrebare nominală (categorică) - răspunsurile multiple sunt acceptabile

Codificarea acestui tip de întrebare se poate face prin adăugarea a câte variabile (în foaia de calcul Excel: coloană) câte răspunsuri posibile și indicând cu două coduri diferite dacă respondentul a bifat opțiunea de răspuns dată. Procedura uzuală este codarea 0/1, deci 0 este înregistrat dacă răspunsul nu este marcat; 1 este datele înregistrate dacă răspunsul este bifat.

Este recomandabil dacă identificatorul variabilelor indică faptul că este un grup de răspuns asociat. Acest lucru poate fi rezolvat prin primele două până la trei caractere ale identificatorului referitoare la întrebare și caracterele ulterioare referitoare la opțiunea de răspuns. Caracterele inițiale ale identificatorilor sunt, prin urmare, aceleași, ceea ce este, de asemenea, bun, astfel încât răspunsurile să fie organizate împreună într-o listă de variabile (pachetele statistice fie lasă variabilele în ordinea fișierului, fie le sortează: oricare dintre opțiuni este activată, vezi răspunsurile aferente unul lângă altul).

Identificatori și codarea primei întrebări din exemplu:

Identificatori și codificarea celei de-a doua întrebări:

Variabila măsurată pe o scală ordinală, de interval și de raport

Aceste tipuri de întrebări ar trebui tratate împreună în ceea ce privește codarea și înregistrarea datelor. În următoarele exemple ilustrative, răspunsul introdus al respondentului este marcat cu caractere italice:

Codificarea se face într-un mod natural: luăm cât mai multe variabile câte răspunsuri posibile și înregistrăm numerele pe care le-ați introdus ca răspuns pe care l-ați cerut.

Figura 14 - Diferite tipuri de întrebări

Identificatori și codarea primei întrebări:

Identificatori și codificarea celei de-a doua întrebări:

Identificatorul și codificarea celei de-a treia întrebări:

5.2.2. Codificarea întrebărilor deschise

Utilizarea întrebărilor deschise este justificată în multe cazuri și are beneficii importante. O întrebare deschisă face mai ușor pentru respondent să explice ceea ce el sau ea are de spus în propriile sale cuvinte. („Care este părerea dvs. despre activitatea reprezentantului regional?”) Există două versiuni de bază ale cunoașterii mărcii: deschisă („Enumerați brandurile de muesli pe care le cunoașteți!” - aceasta este cunoștințe de marcă spontane sau altfel neacceptate) sau închise („ Bifați care dintre mărcile de muesli enumerate aici le cunoașteți! ”- aceasta este cunoașterea mărcii acceptate). Evident, mărcile listate spontan indică o penetrare mai puternică, deci ar putea fi adecvat să întrebați.

Avantajul întrebărilor deschise este, prin urmare, simplitatea în a pune întrebări și părtinire în răspunsuri. Cu toate acestea, datorită naturii eterogene a răspunsurilor, procesarea lor este în mare parte dificilă și poate fi o sursă de multe erori.

Răspunsurile la astfel de întrebări nu pot fi rezumate în forma lor originală, așa că ar trebui să încercăm să clasificăm răspunsurile în categorii tipice de răspunsuri. Categoriile de răspuns pot fi definite în trei moduri: înainte de înregistrare, în timpul înregistrării și la sfârșitul înregistrării.

Definirea categoriilor de răspuns înainte de înregistrarea datelor. Din setul complet de chestionare, 15-20% din eșantion este selectat aleatoriu. Pe chestionarele selectate, examinăm răspunsurile la întrebările deschise și formăm opțiuni de răspuns agregate (categorii) pe baza acestora. Cu această metodă, am transformat întrebarea deschisă într-o întrebare practic selectivă și am codificat-o în conformitate cu regulile variabilei categorice. În timpul înregistrării datelor, un răspuns care nu se încadrează în niciuna dintre categoriile predefinite este plasat într-un grup special, categoria celuilalt răspuns. În cazul în care proporția altor răspunsuri devine prea mare după procesarea setului complet de chestionare, precategorizarea a fost incorectă și celelalte răspunsuri trebuie să fie defalcate în continuare.

Definirea categoriilor de răspuns în timpul captării datelor. Lista categoriilor este în mod constant extinsă în timpul înregistrării datelor. Răspunsul deschis al primului chestionar este codat cu 1, iar codul și semnificația concisă a codului sunt înregistrate într-o listă separată de coduri. Răspunsul la al doilea chestionar este fie acceptat ca fiind identic cu primul (apoi se înregistrează codul 1), fie considerat nou, iar codul 2 este apoi înregistrat. În același timp, adăugăm codul 2 la lista de coduri, precum și semnificația codului. Avantajul acestei proceduri este că nu trebuie să determinăm o categorie fuzionată în prealabil, putem decide să fuzionăm categoriile ulterior în cazuri justificate. De asemenea, nu există niciun risc de creștere excesivă a celeilalte categorii de răspuns. Cu toate acestea, dezavantajul este că încetinește foarte mult înregistrarea datelor și face dificilă gestionarea unei liste de coduri separate. De exemplu, datorită listei lungi de coduri, putem adăuga din nou un răspuns existent cu un cod nou. Probabilitatea acestei erori poate fi redusă prin manipularea a două tabele Excel în timpul captării datelor: fișierul chestionarului real și lista de coduri. Astfel putem sorta din când în când lista de coduri în ordine alfabetică și o putem tipări. O listă de coduri organizată este mult mai ușor de navigat.

Definirea categoriilor de răspuns la sfârșitul înregistrării datelor. În această soluție, presupunem că definiția categoriilor este cea mai exactă dacă putem gestiona toate răspunsurile deschise simultan. Astfel, în timpul captării datelor, răspunsurile deschise sunt înregistrate practic în întregime într-o coloană Excel, în paralel cu codificarea celorlalte date. Revenim la codarea întrebărilor deschise la sfârșitul înregistrării datelor. Listăm, sortăm, analizăm răspunsurile. Funcția de căutare ajută adesea la analiză: foaia de calcul facilitează aflarea dacă un anumit termen apare de mai multe ori în răspunsuri. Deci, decidem categoriile de răspunsuri și codul acestora ulterior, le facem o listă și apoi le imprimăm în ordine. Apoi, în fișierul chestionarului, adăugăm o coloană de cod lângă coloana de text a întrebării deschise și introducem aici codul răspunsurilor. Este recomandabil să păstrați textul complet al răspunsurilor într-un fișier separat, dar de obicei este șters din fișierul chestionar după introducerea codurilor. Avantajul acestei metode este că permite o analiză atentă la determinarea categoriilor. Dezavantajul este că consumă mult timp.

Este dificil să se dea o regulă generală pentru alegerea dintre cele trei opțiuni. Este clar că revizuirea preliminară menționată în prima versiune ar trebui efectuată pentru 15-20% din chestionare pentru fiecare procesare. Dacă descoperiți că răspunsurile pot fi bine tipizate, nu ezitați să decideți despre pre-codare! În rezumat, putem spune că cele trei variante (în ordinea de mai sus) înseamnă creșterea validității codării, dar în același timp necesarul de timp crește.

Pentru a decide între opțiuni, poate fi de asemenea luat în considerare faptul că, atunci când efectuează sondaje pe piețele organizaționale (unde dimensiunea eșantionului este relativ mică), clienții solicită adesea să primească toate răspunsurile la întrebări importante deschise (cel puțin într-o anexă la raport de cercetare de piață). Aceasta este în favoarea alegerii celei de-a treia versiuni.

5.2.3. Verificare după înregistrarea datelor

Este important să verificați sistemul de date înregistrate din două motive. Pe de o parte, poate apărea și o eroare în timpul înregistrării datelor și, pe de altă parte, este recomandabil să efectuați anumite verificări de conținut după înregistrare.

O eroare făcută în timpul introducerii datelor înseamnă că datele care nu sunt în chestionar vor apărea în fișierul de date. Motivul pentru aceasta poate fi neatenția și oboseala persoanei care înregistrează datele. Acest tip de eroare poate fi adesea evitat cu ajutorul instrumentelor de programare. În întrebările de selecție a răspunsului, de ex. datele înregistrate trebuie să fie în intervalul (1,2 ... numărul de răspunsuri posibile) și astfel poate fi programată o verificare automată care nu permite înregistrarea datelor imposibile. În fiecare caz, ar trebui să luați în considerare care este sarcina mai mică: configurarea unei rutine de verificare sau verificarea cu atenție a datelor înregistrate. Verificarea se face făcând un tabel de frecvență al datelor înregistrate, așa că listăm pentru fiecare întrebare ce cod apare în fișierul de date și de câte ori. Comparăm lista întrebare cu întrebare cu chestionarul și verificăm dacă codurile înregistrate indică date posibile. Dacă se găsesc date imposibile, chestionarul este recuperat pe baza numărului său de serie și datele sunt corectate. Este recomandabil să creați imediat un nou tabel de frecvențe pentru întrebarea corectată, deoarece acest lucru va verifica și corectarea și cu siguranță vom avea nevoie de rezultatele tabelului de frecvențe în timpul procesării ulterioare.

Analiza tabelelor de frecvență oferă, de asemenea, o oportunitate de a dezvălui erori de conținut care nu au fost cauzate de neatenția înregistratorului de date, astfel încât fișierul conține exact aceleași date care sunt în chestionar. Datele remarcabile, extreme sunt întotdeauna „suspecte” în acest sens, iar aceste chestionare ar trebui cu siguranță recuperate. Reparația necesară trebuie decisă de la caz la caz; într-o situație nesigură, este mai bine să lăsați datele decât să puneți în pericol corectitudinea procesării (o singură dată anterioară „trage” media și crește foarte mult abaterea standard).

Este foarte dificil să se detecteze o eroare de înregistrare a datelor care apare atunci când datele înregistrate sunt o valoare posibilă și neelevată (de exemplu, întrebăm numărul copiilor din familie, există 2 răspunsuri în chestionar, dar data loggerul lovește accidental trei, care este 2 pe tastatură). situat lângă). Soluția perfectă ar fi înregistrarea dublă și compararea fișierelor, dar ar fi foarte costisitoare. În schimb, este recomandabil să efectuați o verificare detaliată a 1-3% din chestionarele înregistrate (desigur, separat pentru fiecare data logger).