Domanda:
"Garbage in, garbage out" - È scortese chiamare gli altri "lavori come" spazzatura "rispetto al nostro?
Orion
2015-10-26 02:04:09 UTC
view on stackexchange narkive permalink

Sto lavorando a un modello di dati che, credo, produce risultati più accurati e validi di alcuni lavori precedenti di altri, incluso il mio supervisore, che tra l'altro supporta il mio lavoro. Ma finora, la comunità interessata in generale non ha prestato sufficiente attenzione alla necessità di risultati così più accurati in questo campo.

Quando si presenta il mio lavoro (verbale / poster / cartaceo), devo sottolineare l'importanza del problema e la necessità di utilizzare modelli migliori e che se usassimo modelli meno validi (come alcuni di quelli esistenti) dovremmo aspettarci risultati meno accurati.

È scortese usare il assioma dell'informatica " garbage in, garbage out " (o frasi simili) quando si fa riferimento al lavoro di altri in questo contesto?

Modifica : ho perso dettagli importanti. Nel mio caso, per "spazzatura" intendo specificamente i dati di bassa qualità solitamente utilizzati per risolvere il problema, il che rende altri modelli meno validi. Anche se, non lo userei mai perché potrebbe essere interpretato erroneamente come una valutazione delle opere di per sé , piuttosto che delle risorse utilizzate!

Ma io era sorpreso e non si sentiva a suo agio nel leggere l'analogia in un commento pubblicato che criticava i risultati di un altro autore per l'utilizzo di dati inaffidabili!

Sì, sarebbe scortese, poco professionale e poco divertente. In breve, non farlo.
Sì. Questo dovrebbe essere ovvio.
Per quanto riguarda il tuo aggiornamento: beh, sì, gli accademici sono spesso scortesi e poco professionali, proprio come qualsiasi altro gruppo di persone.
Per evitare le cattive connotazioni di spazzatura in immondizia fuori, spesso passo a gold in, gold out. Esprime la stessa idea, l'output è buono quanto l'input e può essere migliorato con dati di input migliori. Ma non sono sicuro che prenderei in considerazione l'utilizzo di GIGO in entrambe le formulazioni in un documento formale al di fuori di CS.
Come potresti * possibilmente * pensare che potrebbe non essere scortese chiamare "spazzatura" il lavoro di qualcun altro?
E ricorda "tutti i modelli sono sbagliati, alcuni sono utili" - George Box
"Garbage in - garbage out" è vero per qualsiasi modello o algoritmo (ad esempio anche il tuo), quindi non è una critica a un dato modello o algoritmo. Quindi non è maleducato, ma di solito non è usato come intendi.
@guifa No, le due affermazioni non sono equivalenti.
Se vuoi essere discreto e comunicare in modo efficace allo stesso tempo, prova a fare riferimento ai dati danneggiati come spazzatura, ma non usare lo stesso termine per il processo che li ha generati. Chiamalo invece "difettoso". Se il programmatore è seccato dalla parola "difettoso", allora hai a che fare con qualcuno che è troppo sensibile per lavorare in una squadra. E, naturalmente, potresti sbagliarti.
Questa frase viene spesso utilizzata per indicare che quando i dati di input sono errati non è possibile ottenere un output significativo. Non il modello. È particolarmente utile quando si lavora con le parti interessate che pensano che un ottimo algoritmo risolverà magicamente i loro problemi di dati non validi ...
perché questa domanda ha ricevuto molti voti positivi se quasi tutti qui pensano che sia completamente ovvio che sia scortese e poco professionale
@bubakazouba: Perché in SE di solito non votiamo "mi piace o non mi piace" (opinioni) sull'argomento di una domanda (a meno che non sia fuori tema, ovviamente), ma sulla qualità _tecnica_ della domanda: è ben formulata, non un duplicato, ... Anche se sono d'accordo che la domanda potrebbe essere migliorata, non è di gran lunga una domanda di bassa qualità. Quindi, merita alcuni voti positivi. Alla fine, SE è _all_ sulle domande. Se qualcosa è "completamente ovvio" è negli occhi di chi guarda.
Alla tua domanda mancano alcuni dettagli importanti: come sottolineato da altri, GIGO non si riferisce _per se_ alla qualità del modello, ma alla qualità dei dati di input e alle sue implicazioni. Allora, qual era esattamente l'input, quale output nel lavoro precedente? Il modello era l'output? Ad esempio, hanno addestrato il modello con dati di input errati, il che ha portato a un modello non realistico?
Dipende tutto. Ti piace il tuo lavoro? Apprezzi uno stipendio regolare? Vuoi continuare a lavorare presso il tuo attuale datore di lavoro? Preferiresti non essere ridotto in poltiglia nel parcheggio dai tuoi colleghi? Se hai risposto "sì" a una qualsiasi delle domande di cui sopra, potresti considerare di giudicare meno il lavoro degli altri e forse considerare che ciò che hanno fatto è stato un miglioramento rispetto a ciò che era accaduto prima. Se, d'altra parte, hai risposto "no" a tutte queste domande, ehi, gioco ON, amico! Cerca solo di avere un altro lavoro in fila prima - solo, sai, nel caso ...
Non intendo essere cattivo, ma come diavolo non sembra una cosa davvero orribile da dire? Perché avresti anche questa domanda? Ovviamente chiamare spazzatura il lavoro di altre persone è offensivo.
Otto risposte:
jakebeal
2015-10-26 02:31:02 UTC
view on stackexchange narkive permalink

Sì, è scortese descrivere il lavoro di qualcun altro come spazzatura, e inutilmente. Lo hai già detto molto meglio tu stesso:

se usassimo modelli meno validi dovremmo aspettarci risultati meno accurati

Non c'è motivo di confondere questo semplice dichiarazione fattuale con un giudizio di valore. Solo perché qualcosa funziona male non significa che sia spazzatura: potrebbe anche essere semplicemente prima e meno ben progettata. Chiameresti una Model T "spazzatura" solo perché offre prestazioni inferiori rispetto a un'auto attuale?

La tua logica è ... manca qualcosa. La conclusione che vuoi è "non chiamare roba spazzatura; è un male per la tua carriera". Dici che è brutto perché è maleducato; bene. Ma poi parli di giudizi di valore, come se essere un giudizio di valore (negativo) rendesse qualcosa di maleducato. E poi parli di quanti anni le cose potrebbero essere solo peggiori e quindi il giudizio di valore "spazzatura" è errato all'inizio, ma anche questo non segue; il lavoro di alcuni ricercatori è davvero spazzatura e rimarrà tale tra 80 anni.
Il dibattito sui giudizi di valore è inutile, quindi le persone cercano di attenersi ai fatti per evitare discussioni infinite. C'è sicuramente spazzatura in giro, ma le persone non saranno d'accordo su quale, a meno che non sia una tale spazzatura che non vale la pena menzionarla.
@ChrisWhite Ho un problema più profondo con un insulto come "spazzatura", che è che non è molto informativo. Tutto ciò che "spazzatura" mi dice è che alla persona che usa la parola non piace qualcosa, ma non dice perché. È mal messo a terra? Mal motivato? Eseguito in modo sciatto? Semplicemente incomprensibile? Una parola come "spazzatura" è essenzialmente [* ad hominem *] (https://en.wikipedia.org/wiki/Ad_hominem) per le idee, e un argomento altrettanto povero lì come * ad hominem * normalmente lo è per le persone.
Massimo Ortolano
2015-10-26 02:33:47 UTC
view on stackexchange narkive permalink

Non solo sarebbe scortese, ma anche decisamente sbagliato. La scienza procede per approssimazioni successive producendo modelli sempre migliori. Ma quando troviamo una migliore approssimazione, non iniziamo a chiamare tutti i modelli precedenti "spazzatura", per almeno due motivi:

  1. Per rispetto, perché sappiamo che non lo faremmo ho trovato questo nuovo modello senza tutti i precedenti. E se qualcun altro dovesse trovare un modello migliore di quello ideato da noi, non vorremmo sentire il nostro lavoro chiamare spazzatura.
  2. Un modello nuovo e migliore non rimuove necessariamente tutti i modelli precedenti, perché il dominio di applicabilità potrebbe non sovrapporsi completamente.

Pertanto, evidenzia le qualità del tuo lavoro , ma non essere scortese riguardo al lavoro di coloro che sono venuti prima di te.

Stackstuck
2015-10-26 04:43:40 UTC
view on stackexchange narkive permalink

Penso che il problema qui sia che stai combinando l'input / output non valido di garbage in garbage out con, beh, modelli meno accurati vengono sostituiti da modelli più accurati, il che è COMPLETAMENTE una cosa diversa. Se si inseriscono dati inutili nel modello, si otterranno risultati inutili dal modello. Ciò non cambia, non importa quanto sia sofisticato il modello.

In breve, no, da entrambi i punti di vista CS: il tuo modello avrebbe lo stesso problema di qualsiasi altro modello, o addirittura qualsiasi pezzo di codice, prendendo input non valido - e, come altri hanno detto, un punto di vista appropriato, in quanto non dovresti insultare il lavoro di tutti gli altri.

E: Forse un altro modo per dirlo. Stai confondendo l'input con i calcoli e la modellazione effettivi. Se qualcuno inserisse i dati dello stesso tipo nel tuo modello, sarebbe altrettanto traballante nell'affidabilità dei calcoli. La precisione dei calcoli è tutta un'altra questione.

Un'altra nota: mi sto avvicinando a questo solo dal punto di vista di un programmatore, ma i punti sul non insultare altre persone sono tutte ottime ragioni per non usare GIGO nella tua presentazione.

E2: Ok, sembra che io stia montando in serie mentre penso alle cose.

Per quanto riguarda la tua modifica ("dettagli importanti persi ..."):

Non capisco quello che stai dicendo qui.

Stai dicendo che stai spingendo per un input più accurato? O stai dicendo qualcos'altro? La tua domanda e il tuo chiarimento sono in contrasto.

Per quanto riguarda la sezione "E2", le richieste di chiarimento della domanda dovrebbero essere inserite nei commenti sulla domanda, non nelle risposte. Dovresti avere abbastanza rappresentante per iniziare a postare commenti presto (1 voto positivo in più dovrebbe farlo.) Puoi trovare alcune informazioni generali su cosa ci si aspetta dalle risposte in [risposta]. Altre informazioni su come funzionano i siti SE possono essere trovate nella [guida].
Mi piace questa risposta! In GIGO, la prima G si riferisce all'input che viene elaborato nel programma. Nel tuo caso, stai * raffinando un modello *. Questo ti darà risultati migliori. GIGO non è neanche lontanamente rilevante.
TOOGAM
2015-10-26 11:53:37 UTC
view on stackexchange narkive permalink

Non sono d'accordo con alcune delle altre opinioni qui.

GIGO è un termine riconosciuto nel settore. Usarlo in modo appropriato è, beh, appropriato, anche se le persone in altri settori non riconoscono il termine come un termine molto comune e utilizzato in modo appropriato.

Inoltre, nel mondo degli affari reali, le persone prendono in giro alla concorrenza nella pubblicità. L'ho sicuramente visto fare prima. Molte università sono progettate per prepararti per il mondo degli affari.

Puoi sfiorare alcune sensibilità e forse persino offendere alcune persone, mentre altre persone potrebbero ridacchiare. In breve, il tuo livello di successo può dipendere da quanto conosci il tuo pubblico. Ciò che funziona bene per i programmatori di computer potrebbe non funzionare altrettanto bene per un pubblico che non riconosce il gergo e attribuisce molto valore a cose come mostrare rispetto per gli altri.

Tuttavia, anche se il tuo pubblico potrebbe apprezzare un riferimento GIGO, devi assicurarti di utilizzare il termine correttamente. In qualità di programmatore di computer, conosco bene la frase. "Garbage", in questo caso, di solito non significa "dati di bassa qualità". Significa "dati errati" o "dati casuali che potrebbero essere errati e c'è un'alta probabilità che (almeno alcuni dati siano) errati". "Bassa qualità" non si adatta perfettamente alla descrizione tecnica di "spazzatura". Eventuali punti di astuzia che potresti meritare sarebbero compensati dall'inadeguatezza della tua semplice inesattezza.

C'è un altro uso di "Garbage" nell'informatica, vale a dire Garbage Collection. In quel contesto, spazzatura significa solo la memoria che non è più necessaria. Non sono né dati di bassa qualità né dati errati. Il suo unico significato è "non più necessario".
Il riferimento _garbage_ in GIGO si riferisce a dati di input errati, come sottolinea la tua risposta. Se non ti dispiace aggiungere un po ': GIGO non è un'accusa contro il sistema che esegue i dati; piuttosto, GIGO significa essenzialmente che, non importa quanto possa essere buono il sistema [software] originale, se si inseriscono dati errati in esso, si otterranno inevitabilmente dati errati da esso. L'acronimo [risale a molto tempo fa] (https://en.wikipedia.org/wiki/Garbage_in,_garbage_out#History); Ricordo che me lo spiegò mio nonno negli anni '70. Finché viene utilizzato in modo accurato e appropriato, penso che vada bene l'uso.
@scaaahu Il significato di "garbage" nel concetto di garbage collection è completamente diverso e irrilevante rispetto al significato di "garbage" in GIGO.
Penso che questo sia abbastanza vicino - vorrei notare che lo userei solo in un ambiente informale. Non userei questa frase nel mio documento di analisi della causa principale, ma è più perché sarei più specifico sul motivo per cui i dati non hanno funzionato, non perché ho paura di insultare la vacca sacra di qualcuno.
brian_o
2015-10-27 03:51:09 UTC
view on stackexchange narkive permalink

All'inizio hai iniziato parlando di modelli, ma nel tuo aggiornamento sembra che tu stia parlando davvero dei dati raccolti. Sono ancora un po 'poco chiaro.

Ma sembra che tu sia alle prese con l'incertezza in diversi set di dati, quindi propongo che invece di utilizzare il termine informatico GIGO, usi un termine di elaborazione del segnale: rumore. Tutti i dati sono rumorosi, le tue nuove tecniche ti danno un set di dati meno rumoroso e quindi consentono previsioni più accurate.

Joe.h
2015-10-27 17:42:04 UTC
view on stackexchange narkive permalink

In realtà dipende se capiscono che il loro lavoro non era abbastanza buono o se cercano un modo migliore come "ciò che inserisci è ciò che ottieni"

Dikran Marsupial
2015-10-27 20:36:26 UTC
view on stackexchange narkive permalink

La regola d'oro "fa agli altri quello che vorresti che facessero a te" (e le varie affermazioni equivalenti che compaiono in una varietà di codici etici) si applica tanto al mondo accademico quanto altrove. Chiediti, considererei scortese se qualcuno (1) si riferisse al mio lavoro come "spazzatura" nel contesto di GIGO? Se la risposta è "sì, probabilmente", ciò suggerisce che sarebbe scortese anche da parte tua utilizzarlo per fare riferimento al lavoro di altri.

Suppongo che tecnicamente rimanga ancora la domanda se sia accettabile essere scortese con gli altri in un articolo accademico! ; o)

(1) Si dice che "la familiarità genera disprezzo" e nessuno ha più familiarità con la mia ricerca di me, ma c'è una differenza tra disprezzare il mio lavoro e avere qualcun altro per me!

peterh - Reinstate Monica
2015-10-27 23:02:08 UTC
view on stackexchange narkive permalink

Sì, è assolutamente maleducato. Altre risposte spiegano molto bene quanto sia grave se comunichi negativamente in una gerarchia. Estendo questo dall'altro sito:

Sebbene sia scortese, può essere giustificabile. A volte le persone fanno spazzatura, possono avere molte ragioni, molte sono tollerabili, molte no.

E, nominare le cose come sono, rende la situazione molto chiara se la realtà è mascherata da formule educate complesse.

Dipende dall'equilibrio. Ma non dimenticare: le persone intorno a te soppeseranno la vera durezza delle tue parole negative probabilmente più seriamente, come lo intendi tu!



Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...