Domanda:
Devo spiegare il tipo di grafico nella mia tesi di Master?
Nijin22
2018-06-04 13:41:25 UTC
view on stackexchange narkive permalink

Ho condotto un sondaggio per la mia tesi di master e vorrei mostrare i risultati come un box plot:

Box plot, as it will appear in the thesis

(L'asse x elenca diversi livelli di abilità / familiarità, che vanno da "nessuno" a "esperto")

Dovrei menzionare che questo grafico è un diagramma a scatola (nella didascalia o il testo circostante) in modo che le persone che non lo conoscano possano cercare come interpretare questo tipo di diagramma, o sono informazioni non necessarie e posso presumere che tutti capiranno il tipo di grafico solo guardandolo?

Context è una tesi di laurea in informatica in tedesco presso un'università tedesca.

Ha una soluzione molto semplice: rendere l'asse X numerico da 1-5 e spiegare cosa significano quei numeri nella didascalia, o semplicemente aggiungere "1 - Keine, 2 - ..." come didascalia.L'unico motivo per cui questo grafico è confuso è perché i boxplot sono grafici numerici e non ci sono numeri nel grafico.
@AnderBiguri Grazie per il suggerimento, lo terrò a mente.Ma mi piacerebbe vedere una risposta alla domanda "Devo spiegare che questo tipo di grafico si chiama 'box plot', quindi qualcuno che non lo conosce può cercare di cosa si tratta".Stai suggerendo un "No"?
Non hai bisogno di spiegare cos'è un box plot, no.In questo caso, potresti voler aggiungere un po 'di più perché gli assi suggeriscono la classificazione ma la rappresentazione dei dati suggerisce una variabile continua.Non c'è un punto intermedio tra SVN e Git, ma c'è tra Keine e Grundkenn [troppo tedesco].È relativamente chiaro che l'asse X dovrebbe essere continuo, ma un chiarimento (l'aggiunta di numeri) lo renderebbe ancora migliore.Il resto è fantastico.Considera l'idea di dare un'occhiata alle trame del violino, potrebbero essere una rappresentazione migliore dei tuoi dati in questo caso (e sembrano davvero fantastiche)
Poiché nessuno lo ha detto chiaramente: questo è il tipo di grafico sbagliato per i tuoi dati.Non utilizzare un Box-plot (né un plot di violino) per dati discreti, solo per dati continui.
L'unica risposta completamente affidabile deve venire dal tuo consulente.
@Roland Buon punto.Ho un'altra domanda più avanti nel sondaggio con dati continui, quindi penso ancora che valga la pena porre questa domanda.
Non dovresti semplicemente dire che "questo è un box plot".Dovresti spiegare come interpretarlo in modo chiaro e conciso, all'interno della didascalia della figura.
@Roland sì.Ovviamente si potrebbe discutere se le categorie discrete abbiano molto senso qui in primo luogo - ognuno avrà una nozione diversa di ciò che dovrebbe significare "abilità intermedie".
Perché non chiedi al tuo consulente piuttosto che a persone a caso su Internet?
@Roland: Nonsense.I boxplot vengono utilizzati per stock o altri dati finanziari (discreti) milioni di volte al giorno.Potete fornire qualche citazione autorevole e indiscussa per affermare il contrario?(Penso che tu intenda variabile indipendente continua, non var. Dep., Ma anche in questo caso è dubbio.
I grafici a torta @smci vengono utilizzati ancora più spesso.Se calcoli i quantili di un campione da una distribuzione discreta, devi definire attentamente come lo fai.Ad esempio, non avere conoscenza o una certa conoscenza è strettamente binaria.Allora, cosa significa un quantile tra "nessuna conoscenza" e "conoscenza di base"?Poiché OP ha solo tre volte cinque categorie, sono facilmente possibili visualizzazioni migliori.Le possibilità includono un [grafico della tabella] (https://i.stack.imgur.com/mfLhM.png) o un grafico a barre centrato.
@smci Ma questo è seriamente fuori tema e non dobbiamo essere d'accordo.Quindi, per favore, non discutiamolo ulteriormente in un thread di commenti.
@Roland: La trama dell'OP va bene e molto più chiara di quelle alternative.(Stai cavillando sul fatto che i livelli in un categorico ordinato e le distanze tra loro non hanno molto o alcun significato numerico, il che è un dibattito senza fine; dipende da come sono stati misurati.) Per favore non pubblicareaffermazioni assolute come * "Questo è il tipo di grafico sbagliato per i tuoi dati" * se non sono generalmente concordate.
Tre risposte:
Dan
2018-06-04 20:32:22 UTC
view on stackexchange narkive permalink

Dovresti utilizzare la didascalia per spiegare cosa dovrebbe indicare il grafico . Vale a dire "Boxplot di dati dell'indagine che mostrano un livello generalmente più elevato di esperienza con SVN rispetto alle tecnologie concorrenti". Ciò consente di ottenere entrambi e supporta ulteriormente il testo della tua tesi, piuttosto che spiegare al lettore qualcosa che dovrebbe essere completamente ovvio (ad esempio "Questo è un grafico a scatole dei dati del sondaggio"). Se includi il tipo di grafico nella didascalia, sarà utile se qualcuno non ha familiarità con quel tipo di grafico e non occuperà molto più spazio che digitando "Grafico dei dati del sondaggio che mostra ..."

Detto questo (e leggermente fuori tema), un grafico a scatole non sembra essere il grafico corretto da utilizzare per trasmettere queste informazioni. Un grafico a scatole dovrebbe essere utilizzato per i dati continui . Qui hai dati discreti (categoriali / ordinali). Forse un grafico a barre (con le diverse categorie mostrate in colori diversi potrebbe funzionare meglio)? Faccio fatica a capire cosa significa il "quartile inferiore" tra "Keine" e "Grundkenntnisse" per Google Docs. Quel 25% degli intervistati aveva esperienza Keine con Google Docs? Molto confuso! Sembra che tu abbia deciso di utilizzare un grafico a scatole e stia cercando di trovare un modo per usarne uno.

Diciamo che voglio sapere quante persone hanno una conoscenza approfondita di SVN, come determino quello dal tuo grafico?

Tuttavia con un grafico a barre ... è chiaro che (ad esempio) 5 persone che hanno risposto erano esperti bar chart showing experience of people in different technologies

La risposta è fuori tema.La domanda non menziona se i dati sono continui o discreti.Non c'è bisogno di saltare alle conclusioni.Anche questa risposta non è utile a persone diverse dal richiedente.
Fisico @Anonymous.I dati sembrano essere ordinali.Nessuno = nessuna conoscenza, conoscenza di base = poco, medio = intermedio, avanzato = avanzato, esperto = esperto.
@henning dipenderà da come è stata posta la domanda.Se la domanda posta fosse "Su una scala da 1 a 100 come ti indicheresti questa tecnologia", la trama potrebbe essere più pertinente di quanto pensi.
Orion
2018-06-04 15:00:24 UTC
view on stackexchange narkive permalink

In generale, sì.

La maggior parte dei potenziali lettori capirà grafici semplici (come i box plot).

Tuttavia, molte tecniche di visualizzazione hanno varianti che producono grafici visivamente simili ma possono avere un'interpretazione leggermente diversa.

Pertanto, è una pratica migliore di presentazione della ricerca per chiarire cosa mostra esattamente la figura e, se necessario, come visualizza i metodi o i risultati dello studio.

Nel tuo caso, ad esempio, nella didascalia consiglio di menzionare almeno che è un box plot. È anche meglio chiarire se la larghezza del riquadro è proporzionale alla dimensione del gruppo, nel qual caso i tre gruppi sembrano avere (quasi) le stesse dimensioni.

Sono d'accordo.È particolarmente importante menzionare qualsiasi deviazione dalle norme, cioè i baffi sono solitamente disegnati a 1,5 volte l'intervallo interquartile e valori anomali oltre questo esplicitamente contrassegnato.Se l'intervallo per i baffi è diverso o i valori anomali sono soppressi, questo dovrebbe essere sicuramente menzionato, altrimenti il lettore presume che non ci siano valori anomali.
nabla
2018-06-04 14:58:18 UTC
view on stackexchange narkive permalink

Probabilmente non è necessario menzionare la parola "Boxplot" nella didascalia dell'immagine stessa (perché è ovvio per il lettore; presumo che la maggior parte dei lettori lo riconoscerà anche se non hanno familiarità diretta con l'interpretazione di un grafico a scatole).

Tuttavia, se intendi dare un suggerimento a un lettore completamente inconsapevole che ciò che vedeèun boxplot, potresti anche menzionare la parola solo una volta nel paragrafo in cui ti riferisci alla figura (es. in Fig. 3.2 "). Immagino che lo farei in questo modo, ma allo stesso tempo non credo che la tua decisione di menzionarlo o meno influenzerebbe in alcun modo il risultato (ad esempio la valutazione).

"suggerire che quello che vedono è un boxplot" questo è tutto!Menzionando solo il nome per facilitare il googling di lettori sconosciuti.


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 4.0 con cui è distribuito.
Loading...