Buongiorno,
scusate se commento con così ampio ritardo...
"Mario Annunziato via Aisa.circuli" <aisa.circuli@???> writes:
[...]
> Personalmente osservo che i termini dati e metadati sono molto
> generici,
in realtà quei termini dovrebbero avere un significato molto ben preciso
per tutti i ricercatori, non dovrebbe esserci nessuna ambiguità, con
l'accortezza che il termine "dato/i" in _tutti_ gli ambiti di ricerca
_deve_ essere interpretato in senso _informatico_ (senza mai perdere di
vista quello _epistemologico_ [1]):
dati:
https://en.wikipedia.org/wiki/Data_(computer_science)
metadati:
https://en.wikipedia.org/wiki/Data_(computer_science)#Characteristics
«Metadata helps translate data to information. Metadata is data about
the data. Metadata may be implied, specified or given.»
(si veda anche
https://en.wikipedia.org/wiki/Metadata)
la cosa fondamentale che tutti i ricercatori dovrebbero comprendere è
che dati e metadati _non_ sono separabili... e che in genere i dati sono
metadati di altri dati da un punto di vista epistemologico... è un
processo _ricorsivo_
> e vorrei vedere quanto sono trasparenti gli algoritmi che generano
> questi ranking.
bingo! :-D
poter "vedere" gli algoritmi però non è sufficiente perché gli algoritmi
sono "parole": è l'implementazione che conta, il software.
detto in altri termini, tutte le ricerche (il ranking è frutto di una
ricerca [2]):
1. implicano l'uso di software (sfido a trovare oggi una sola ricerca
che non faccia uso di software), che implementa determinati algoritmi
2. implicano l'elaborazione di dati e matadati da parte del software di
cui sopra
inoltre, per essere considerate scientifiche le ricerche _devono_ essere
riproducibili [3] (altrimenti è /opinione/); conditio sine qua non per
la riproducibilità (replicabilità) della ricerca è:
«the results should be documented by making all data and code available
in such a way that the computations can be executed again with identical
results.»
va da sè che il "code" citato sopra NON deve essere proprietario,
altrimenti non è disponibile "in such a way..."
in caso contrario, la "replication crisis" [4] rischia di diventare
_endemica_ in tutte le ricerche scientifiche
ecco perché non basta chiedere la trasparenza (cosa vuol dire?) dei
dati: è assolutamente necessario che i ricercatori possano _liberamente_
utilizzare dati, metadati _e_ software _esattamente nei termini
specificati nelle 4 libertà del software libero:
--8<---------------cut here---------------start------------->8---
Freedom 0: The freedom to use the **data, metadata and program** for any
purpose.
Freedom 1: The freedom to study how the program works, and change it to
make it do what you wish.
Freedom 2: The freedom to redistribute and make copies so you can help
your neighbor.
Freedom 3: The freedom to improve the program, and release your
improvements (and modified versions in general) to the public, so that
the whole community benefits.
--8<---------------cut here---------------end--------------->8---
(ho adattato la Freedom 0)
per dirla con un motto: «Free software, Free science»
senza girarci troppo attorno, il copyright (che riguarda anche le
_banche dati_) è uno dei grossi ostacoli alla libertà scientifica.
[...]
> Un po' di concorrenza farà bene tra i produttori di ranking ...
> E' un po' come dire che fa bene la concorrenza tra ciarlatani.
:-D
la meta-scienza è un micidiale modo per smascherare i ciarlatani,
effettivamente
> Il 2024-04-16 11:14 Maria Chiara Pievatolo via Aisa.circuli ha scritto:
[...]
>> La pubblicità dei dati non rende i ranking meno discutibili: li rende
>> soltanto - e questo è certamente un aspetto importante - più facili
>> da discutere.
sì ma "solo" perché dichiarazioni come la "Barcelona declaration" di cui
si discute in questo thread avanzano delle richieste del tutto
insufficienti
avere i dati e i metadati (che poi, vogliamo discutere delle
_condizioni_ poste all'accesso?!?) è _ampiamente_ insufficiente
serve anche il codice, _anche_ dei sistemi di ranking: solo i
/ciarlatani/ non lo vogliono mostrare, perché si esporrebbero alla
ridicolaggine
[...]
Cordiali saluti, 380°
[1] es.
https://en.wikipedia.org/wiki/Epistemology (cercare "data"),
https://en.wikipedia.org/wiki/DIKW_pyramid
[2] le classifiche sono frutto di "benckmarking", ovvero "analisi
comparativa"
[3]
https://en.wikipedia.org/wiki/Reproducibility
[4]
https://en.wikipedia.org/wiki/Replication_crisis
--
380° (Giovanni Biscuolo public alter ego)
«Noi, incompetenti come siamo,
non abbiamo alcun titolo per suggerire alcunché»
Disinformation flourishes because many people care deeply about injustice
but very few check the facts. Ask me about <
https://stallmansupport.org>.