Data, signál a šum
| 29. 5. 2023Signál je informace, která nás zajímá. Informace, která nás nezajímá, je šum: pozadí, odpad a nepříjemnost. Jak se vlastně rozhodujeme, co je co? Jedná se o naše myšlenkové rozhodnutí. Když jdu vyzvednout synka z mateřské školky, jasně identifikuji, zda za dveřmi brečí on, nebo jiné dítě. Můj mozek rozezná jeho pláč (= signál) mezi ostatními. S tím souvisí citlivost. Citlivost je naše schopnost kvantitativně rozlišit signál (informaci, která mě zajímá) a šum (informaci, která mě ruší). Kupříkladu v restauraci vás něco vyruší, váš mozek zaregistroval zvuk hlasu. Možná zavřete oči, abyste snížili datovou zátěž čili zvýšili poměr signálu k šumu, a najednou zjistíte, že slyšíte spolužáka sedícího o tři stoly dále, kterého jste neviděli patnáct let.
Naše běžná detekční zařízení, která se standardně používají třeba při zjišťování přítomnosti vodíku, rozeznají z jednoho milionu molekul jednu, která nás zajímá. Přístroj pro detekci úniku metanového plynu má citlivost zhruba 40 ppm. Dalším příkladem mohou být senzorické detektory pesticidů, jejichž citlivost je na úrovni jednotek ppb (particle per bilion), tj. jedné molekuly pesticidu z miliardy jiných molekul.1) Pro představu: aby potraviny byly bezpečné pro konzumaci, nesmí obsahovat více než 1 molekulu až 10 molekul pesticidu ve 100 milionech.2) A jaký alkoholový signál stačí na to, abyste přišli o řidičský průkaz? Podle zákona je to nad jedno promile alkoholu v dechu, to znamená 1000 molekul alkoholu v jednom milionu vydechovaných molekul vzduchu, což je přímo megasignál.
Nezřídka se stává, že to, co se v minulosti zdálo být šumem, skrývalo významný signál. Za příklad poslouží náhodné setkání tří vědců v roce 1984 na konferenci v Austinu v Texasu, které vedlo k debatě o přístroji jednoho z nich. Tento přístroj byl schopen produkovat zajímavé uhlovodíkové nanočástice, podobné částicím pozorovaným v mezihvězdném prostoru. Dnes je známe pod jménem fullereny. Tito tři vědci, Richard E. Smalley, Robert F. Curl, a Harold W. Kroto, dostali za svůj objev v roce 1996 Nobelovu cenu za chemii.3)
V době jejich objevu jsme se domnívali, že uhlíkové nanočástice vznikají jen za velice specifických vzácných podmínek. Jakmile jsme byli schopni je detekovat, začali jsme je nacházet doslova všude tam, kde se spalují složitější uhlovodíkové řetězce, například ve spalovacích motorech.4) Obzvláště dieselové motory jsou velkoproducentem těchto nanočástic, neboť až 90 procent pevné složky jejich spalin je tvořeno uhlíkovými nanočásticemi, zatímco u běžného motoru, je to jen něco okolo 20 procent.5) Vzhledem k rozsahu automobilové dopravy a k tomu, že tyto nanočástice jsou pro člověka toxické, bylo nutno omezit jejich produkci. To vedlo k zavedení filtrů pevných částic u spalovacích motorů a očekává se zákaz výroby dieselových automobilů. V tomto případě, co bylo šumem a procházelo pod naším detekčním radarem, se o 20 let později ukázalo být signálem s velkým impaktem a vysokou cenou, jak pro naši kapsu, tak pro planetu.
Chceme-li v šumu objevovat signály, musíme identifikovat a ideálně eliminovat všechny ostatní příspěvky do přijímaných či měřených dat. Některé šumy můžeme snadno odečíst, jiným se můžeme vyhnout a u těch, kterých se nemůžeme zbavit, se snažíme, aby byly co nejnižší. Nejjednodušší je odstranit periodicky se opakující šum, protože je předvídatelný a modelovatelný. Další šumy pocházejí z měřicího zařízení, které je skoro vždy na bázi sběru elektronů v sensoru nebo detektoru. Je tedy vhodné toto zařízení ochladit, abychom eliminovali termální šum. Dalším šumem zařízení je tzv. vyčítací šum, způsobený tím, jak rychle vyčítáme čili měříme počet elektronů v buňce detektoru či sensoru. Když jsme moc rychlí, nemusíme změřit všechny elektrony, navíc ty zbylé mohou pokazit další měření. S tzv. výstřelovým šumem, tj. náhodným velkým signálem a šumem (např. s kosmickým zářením v CCD kameře), se můžeme vyrovnat tak, že zasažené body vymažeme a nahradíme je průměrem z bodů sousedních, ale to už je velký zásah do dat. No a s ostatním šumem, kterého se nezbavíme, se snažíme vyrovnat třeba tak, že měříme déle, abychom zvedli poměr signálu vůči šumu, co nejvíc to jde.
Poznámky
1) Xu L. et al.: J. Agric. Food Chem., 2022, DOI: 10.1021/acs.jafc.2c05284.
2) Viz zákon 322/1999 Sb., maximální limity reziduí pesticidů v potravinách.
3) https://www.acs.org/education/whatischemistry/ landmarks/fullerenes.html.
4) Schrand A. M. et al.: Nanopart. Res. 7, 145, 2005, DOI: 10.1002/wnan.103.
5) Viz např. Vesmír 76, 628, 1997/11.
Ke stažení
- článek ve formátu pdf [254,94 kB]