Differenze qualitative tra le fotocamere digitali in commercio ce ne sono in termini di quantità di pixel, distorsioni dell’ottica, rumore residuo, algoritmi di compressione, capacità di memoria, velocità di trasferimento ed altro ancora: ma una in particolare salta immediatamente agli occhi, ed è la fedeltà cromatica. A quanto ci risulta, nessuno ha mai tentato prima di effettuare misure oggettive su questo percettivamente fondamentale parametro. Noi lo abbiamo fatto, ed i risultati non sono mancati.
Più o meno tutti, quando osserviamo criticamente una fotografia, poniamo subito l’attenzione sulla “grana” e sulla vivacità del colore. Nella fotografia elettronica la “grana” è assimilabile a due parametri quantificabili in modo (relativamente) semplice, che sono la risoluzione (intesa come potere risolutivo totale, non semplicemente come quantità di pixel) ed il rumore residuo, mentre dell’altro e forse ancora più determinante non si è in pratica mai parlato sulle riviste se non in termini sconsolatamente qualitativi, descrivendone la “naturalezza” o la “saturazione”, ma senza mai ridurre tutto a dei numeri o a dei grafici tali da permettere la costruzione di classifiche di merito. Digital Video ha indagato sin dagli esordi sulla fedeltà cromatica di videoproiettori e televisori: lo stesso abbiamo fatto ora con le fotocamere digitali, adattando ovviamente le metodiche di rilevazione ed interpretazione dei risultati alle peculiarità del mezzo.
La misura del colore
Di questo argomento abbiamo trattato approfonditamente ed a più riprese, in particolare sul numero 9 (gennaio 2000), ma qui dobbiamo necessariamente riprendere in breve la questione per poter essere chiari anche con i lettori nuovi e con quelli distratti. Ogni colore percepibile dall’occhio umano può essere descritto senza incertezze da dei numeri, che corrispondono a punti specifici del particolare “spazio colore” preso in considerazione. Il più “famoso” di tutti gli spazi impiegati per la rappresentazione del colore è lo spazio CIE1931, definito appunto nel 1931 dalla Commission Internationale de l’Eclairage, che ad ottant’anni dalla sua fondazione è ancora viva e vegeta (http://www.cie.co.at/cie/) e rimane uno degli organismi internazionali non-profit più importanti ed autorevoli nel campo della “scienza ed arte” dell’illuminazione.
Il piano CIE1931 è riportato in figura 1: nel suo irregolare perimetro sono racchiusi tutti i colori che l’occhio umano può distinguere (ma che NON SONO quelli che vedete: gli standard attuali ed i processi di stampa consentono solo una vaga approssimazione dei colori veri più saturi!), lungo il quale corrono i colori “puri” e totalmente saturi dell’arcobaleno (corrispondenti cioè alle singole righe spettrali della gamma delle lunghezze d’onda visibili, che approssimativamente va da 380 a 780 nanometri). Applicando a questo piano una legge fondamentale della colorimetria, la prima legge di Grassman sulle miscele cromatiche (“qualunque colore può essere ottenuto da una combinazione lineare di altri 3 colori, atteso che nessuno di questi possa essere ottenuto da una combinazione degli altri 2“), arriviamo subito ad un altro concetto fondamentale: il gamut, ovvero la gamma di colori che può essere riprodotta da un certo dispositivo. Nel caso delle immagini elettroniche (ovvero tutte quelle le cui informazioni sono racchiuse in un file, anche se magari provengono da uno scanner di negativi fotografici) sappiamo bene che i colori primari sono il rosso, il verde ed il blu, o meglio un certo rosso, un certo verde ed un certo blu, che cambiano, seppur non enormemente, a seconda dello standard considerato e che sono definiti da una coppia di coordinate. Le loro posizioni sul piano CIE1931 definiscono un triangolo che corrisponde appunto al gamut del sistema RGB, ovvero all’insieme di colori che la terna RGB di colori primari prescelti può visualizzare.
In figura 2 osserviamo alcuni gamut di sistemi o dispositivi diversi a confronto. Se ad esempio parliamo di televisione, sappiamo già bene che lo standard NTSC “batte” il nostro EBU-PAL, perché le coordinate dei suoi colori RGB fondamentali sono un poco più “esterne” di quelle prescelte per il nostro sistema, che essendo anche più lento in termini di scansione (50 Hz contro i 60 dell’NTSC) vince su questo solo in termini di risoluzione. Gli inchiostri di stampa hanno a loro volta un gamut (in questo caso relativo ovviamente ad uno specifico illuminante esterno, visto che gli inchiostri non emettono bensì riflettono la luce) diverso e (generalmente) solo in parte sovrapposto a quello della terna RGB dei monitor e dei televisori (il che vuol dire che non tutti i colori che vediamo sul monitor sono trasferibili in una stampa, neppure con carta di qualità superlativa). Da notare anche che la fotografia chimica, ed in particolare quella su diapositiva, è potenzialmente dotata del gamut più ampio (poi dipende ovviamente dal film specifico e dall’abilità/cura del laboratorio che effettua lo sviluppo/stampa…), anche se ovviamente è pure quella maggiormente soggetta ad usura nel tempo, il che ci dà anche una prima indicazione: le migliori foto tradizionali sono al giorno d’oggi, e fino a vere rivoluzioni nell’ambito della codifica dei colori, cromaticamente più ampie e forse appaganti rispetto ad equivalenti riprese digitali, anche quando queste ultime siano semplicemente visualizzate su un display.
Non parliamo poi di quando un’immagine digitale viene trasferita su carta… o meglio, ne parleremo a tempo debito.
Ad ogni modo, una foto digitale nasce eminentemente per essere riprodotta da un monitor, ed è quindi soggetta alle limitazioni del gamut del monitor stesso. Questi limiti non sono in sé particolarmente stringenti, nel senso che, se sfruttato appieno, anche il gamut del PAL offre colori naturali e percettivamente piuttosto saturi, ma il problema è proprio questo: in che misura le fotocamere codificano in maniera corretta i colori che possono rientrare all’interno del gamut di un display? E come mettere alle corde il sistema di codifica, ovvero le terne di filtri colorate che coprono i singoli pixel dei sensori e l’algoritmo che presiede alle eventuali correzioni di bilanciamento cromatico?
In commercio esistono dei soggetti standard (ad esempio il target IT8, venduto anche da Kodak ed Agfa) per la calibrazione di dispositivi addetti al trattamento del colore, ma noi abbiamo preferito percorrere una via diversa: visto che il gamut limite rappresentabile è quello di un monitor, perché non impiegare proprio un monitor per generare il pattern dei colori dei quali misurare la fedeltà?
Il triangolo limite
Quella che abbiamo realizzato è una sorta di “carico limite” del colore: abbiamo cioè costruito delle immagini fatte di settori colorati, le cui coordinate cromatiche si muovessero sui colori-limite, quelli che giacciono sul perimetro del triangolo di gamut. Il programma redatto allo scopo, che abbiamo chiamato “TRIGAMUT” ed una schermata del quale compare in figura 3, opera sulla base di misure rigorose effettuate sui parametri fondamentali del monitor impiegato, che sono le seguenti:
- Le coordinate cromatiche dei 3 tipi di fosfori. Per misure effettuate sul triangolo-limite, queste devono essere esterne o coincidenti con quelle dello standard di riferimento.
- Il punto di bianco effettivo. Il bianco del sistema di riferimento (che nel nostro caso coincide con quello dell’illuminante standard D65, a sua volta approssimazione del colore della luce solare) dovrebbe essere ottenuto quando tutti e 3 i cannoni del CRT emettono alla massima intensità, ma nella realtà sussistono quasi sempre differenze più o meno grandi dovute agli squilibri di calibrazione (o di usura).
- Il gamma. Il gamma (anche qui dobbiamo forzosamente ripeterci) è l’esponente che lega, a meno di una costante additiva, l’intensità luminosa emessa dal CRT alla tensione applicata all’ingresso, per ogni componente cromatica. In realtà bisognerebbe però parlare di “curva di gamma”, perché la misura differenziale di questo parametro (ovvero il suo valore in un piccolo intorno di un punto specifico della relativa curva) non è mai pienamente costante.
Per poter operare correttamente, TRIGAMUT richiede solo un monitor rispondente al criterio (1), perché poi, inserendo i valori misurati, provvede alla correzione delle irregolarità dei parametri (2) e (3).
Evitiamo al lettore poco interessato alla matematica la noiosa descrizione dell’algoritmo che – premessa la suddetta perfetta conoscenza dei parametri fondamentali – consente di passare dalle coordinate cromatiche del piano CIE1931 ai valori dei registri RGB necessari per realizzare quel colore e poi ancora all’operazione inversa, quella che dalla lettura dei settori fotografati dalle fotocamere permette di risalire a quello che è il colore nello standard di riferimento, ovvero il colore che verrebbe restituito da un monitor pienamente rispondente allo standard. Diciamo solo che si tratta di risolvere dei sistemi di equazioni derivate dal prodotto di due matrici, e che l’accurato rilevamento del gamma in funzione dell’intensità emessa da ogni cannone è determinante per la piena corrispondenza tra colore desiderato e colore ottenuto. Naturalmente non ci siamo limitati alla teoria… ogni singolo settore colorato è stato poi singolarmente misurato con i colorimetri, e le (normalmente minuscole) differenze sono state “trimmate” manualmente. È questo il motivo fondamentale per cui le rilevazioni sono state effettuate su 6 soli colori: i 3 fondamentali ed i 3 intermedi, ovvero quelli che cadono a metà strada tra i primi. Potevamo facilmente automatizzare il tutto e ricavare molti più punti di misura, abbiamo invece preferito effettuare meno rilevamenti ma più accurati.
Il triangolo al 50%
Naturalmente, in natura, non esistono solo i colori saturi, ma anche le “mezze tinte”. Per questo motivo abbiamo ripetuto la misura anche per un triangolo pari al 50% di quello massimo (ovvero un triangolo i cui vertici cadono nel punto intermedio di ciascuna delle 3 congiungenti dal punto di bianco ai colori primari). La misura ad un livello di saturazione intermedio è necessaria anche per valutare un altro parametro fondamentale, ovvero la linearità cromatica: se infatti il firmware di gestione della camera fosse “istruito” per compensare eventuali difetti dei filtri primari la misura con croma al 100% potrebbe anche risultare affetta da qualche forma di “clipping” sulle singole componenti, e quindi non sempre corrispondente alla realtà operativa.
Esecuzione del test
Un altro output di TRIGAMUT consente di realizzare un certo numero di “scacchi” nell’area centrale di un monitor (quella di norma maggiormente luminosa ed uniforme, anche cromaticamente) con le coordinate desiderate, e visto il ridotto numero di punti di misura è quello che abbiamo poi preferito impiegare. Il monitor è stato fatto operare ad alta frequenza di scansione (120 Hz), in modo da ottenere la copertura completa ed uniforme dell’area interessante nel pur breve intervallo di apertura del diaframma, e tutte le fotocamere sotto test sono state impiegate allo stesso modo, ovvero in “automatico”, avendo però ovviamente cura di non produrre, in ogni singolo quadro, saturazione in nessuno dei colori primari. Le fotografie sono state esportate in formato JPEG al minimo livello di compressione. In sede di analisi, i singoli scacchi sono stati sottoposti a filtratura passa-basso (di tipo mediano) per eliminare l’effetto di eventuali rumori o disuniformità locali, poi è stato letto il valore di massima frequenza (centro della gaussiana di distribuzione) per ogni componente RGB ed è stato ricavato il colore corrispondente in un monitor perfettamente rispondente allo standard EBU.
Rappresentazione dei risultati
Come detto, ogni fotocamera è stata misurata per una saturazione del 100% e per una del 50%. I risultati, in due grafici distinti, sono stati rappresentati sullo stesso piano CIE, riportando sia il triangolo di gamut standard del monitor (il “segnale di ingresso”, tratto bianco) che il poligono ottenuto dalla lettura dei 6 punti di misura (il “segnale di uscita”, tratto nero), oltre al punto di bianco (da confrontare con il punto di bianco standard, l’illuminante D65). Nel caso ideale, il poligono di gamut risultante è di nuovo un triangolo corrispondente al triangolo d’ingresso: nella realtà, le fotocamere migliori mantengono la forma triangolare ed approssimano l’estensione del triangolo standard, ma con una moderata desaturazione dei colori; nelle meno buone si notano distorsioni e desaturazioni anche di entità differente per ogni singola componente cromatica, e comportamenti non proporzionali tra i due test. Ogni aspetto del comportamento cromatico delle macchine in prova è naturalmente commentato in modo esaustivo.
Conclusioni
Quando si tratta di produrre delle scale di qualità soggettiva le misure non servono a nulla, se non sono esse stesse messe alla prova prima di essere applicate, verificandone (in modo oggettivo, ovvero con test psicometrici: ma qui il discorso diventerebbe lungo…) la corrispondenza con quanto il nostro sistema sensoriale ed il nostro cervello percepiscono ed interpretano del mondo esterno. In questo caso abbiamo chiesto a più utilizzatori di fornire un parere soggettivo sul colore delle riprese effettuate con le varie camere e – non senza una certa nostra sorpresa – abbiamo ricevuto indicazioni del tutto univoche e concordanti con l’esito dei test. Se nella valutazione della qualità audio riusciremo ad ottenere lo stesso grado di correlazione tra misure e visione che oggi possiamo vantare nel campo dei videoproiettori e – da ora – anche della qualità cromatica delle immagini statiche, potremo forse anche smettere di condurre sessioni di ascolto prolungate e talvolta estenuanti come quelle che effettuiamo oggi.
di Fabrizio Montanucci
da Digital Video n. 25 giugno 2001