Aktuální číslo:

2024/6

Téma měsíce:

Éčka

Obálka čísla

Signál a šum ve fyzice částic

 |  29. 5. 2023
 |  Vesmír 102, 315, 2023/6
 |  Téma: Signál a šum

Ve vědách je šum – na rozdíl od české státní hymny – nežádoucím jevem provázejícím každé měření. Není to však jediná obtíž, s níž se musí experimentátor vyrovnat, jestliže chce z experimentu získat požadovanou informaci.

Oddělit co nejlépe signál od šumu je důležité ve všech odvětvích experimentální fyziky. Měření, která provádíme v částicové fyzice, jsou však natolik komplexní, že potřeba oddělit „zrno od plev“ vyvstává v různých úrovních měření a zpracování dat.

Komplexnost zmíněných měření si ilustrujme na situaci z „běžného života“. Někde pod širým nebem se koná koncert oblíbené hudební skupiny a my chceme zjistit, kolik našich známých se ho účastní. Jako detektor použijeme digitální fotoaparát. Jednotlivé pixely fotoaparátu detekují přicházející fotony. Čím více fotonů (tedy více světla), tím menší fluktuace, a tedy menší šum, který se na fotografii projeví jako menší zrnitost. Večer, při horších světelných podmínkách, sice můžeme prodloužit dobu expozice, ale posluchači se mohou hýbat a výsledný obrázek nemusí být dostatečně ostrý. Abychom mohli rozpoznat jednotlivé tváře, musíme optimalizovat poměr mezi dobou expozice a ostrostí snímku. Dalším krokem bude analýza získaných dat – tedy identifikace našich známých z pořízeného snímku. Při malém počtu účastníků můžeme snímek či snímky prohlížet osobně a sami hledat známé tváře, při velkém počtu účastníků patrně použijeme sofistikovanější metody na rozpoznání obrazu, včetně metod umělé inteligence. Podobně jako v částicové fyzice se musíme smířit s tím, že velikost daného signálu (zde počtu známých) bude mnohem menší než množství šumu (zde počet ostatních účastníků koncertu, kteří nás nezajímají).

Detektor

Šum vzniká v důsledku fyzikálních procesů v detektoru (např. tzv. temný proud ve fotonásobiči) či pochází z vyčítací elektroniky. Případné nedostatky lze pak jen velmi složitě, pokud vůbec, eliminovat na úrovni zpracování dat. Z tohoto důvodu je věnována velká péče designu jednotlivých detektorů a elektronických obvodů, které musí být dostatečně odolné a stabilní vůči vnějším podmínkám, jako je např. teplota, magnetické pole či radiační zátěž. Příprava experimentů je proto náročná a časově zdlouhavá záležitost, mimo jiné i proto, že jednotlivé komponenty detektorů je potřeba velmi pečlivě otestovat v různých extrémních podmínkách.

Jako příklad zkoumání a snížení šumu uveďme hadronový kalorimetr Tilecal [1, 2] na experimentu ATLAS [3]. Kalorimetr je zařízení, jehož úkolem je měřit energii a směr všech primárních částic, které do kalorimetru přiletí a jsou v něm absorbovány. Primární částice interaguje s materiálem kalorimetru, a vytváří tak množství sekundárních částic – elektromagnetické či hadronové spršky. Aktivní detekční prvky měří signál od těchto sekundárních částic v různých vrstvách kalorimetru, celkový signál je pak úměrný energii primární částice.

Hadronový kalorimetr Tilecal sestává z ocelových desek sloužících jako absorbátor a ze scintilačních destiček v roli aktivních detekčních prvků (obr. 1). Část energie, kterou elektricky nabité sekundární částice zanechají ve scintilátoru, je vyzářena ve formě světla a toto světlo je pak po stranách scintilátorů sbíráno optickými vlákny a vedeno k fotonásobičům. Zde je přeměněno na elektrický signál, který je dále zpracováván poměrně složitou vyčítací elektronikou.

Při vývoji tohoto kalorimetru jsme řešili problém zvyšující se hladiny elektronického šumu v některých kanálech. Ukázalo se, že příčinou tohoto šumu jsou napájecí zdroje, umístěné v blízkosti vyčítací elektroniky. Čím blíže byla elektronika daného kanálu ke zdroji napětí, tím byl šum vyšší. Vhodnou úpravou zdrojů se pak podařilo tuto závislost z velké části eliminovat.

Analýza dat

Při vlastním měření určitého fyzikálního procesu se setkáváme s jiným problémem. Procesy, které chceme proměřit nebo jejichž existenci chceme potvrdit, jsou obvykle velmi vzácné vzhledem k ostatním již známým procesům. Poměr pravděpodobností výskytu sledovaného procesu (signálu) vůči ostatním konkurenčním procesům (označujeme je souhrnně jako pozadí) může být i mnoho řádů, jde tedy opravdu o hledání příslovečné jehly v kupce sena. Abychom mohli signál v takové záplavě pozadí objevit, potřebujeme velký vzorek experimentálních dat a dále je nutné pozadí co nejvíce eliminovat vhodným výběrem proběhlých událostí (srážek). Přesto se pozadí nikdy zcela nezbavíme, a musíme ho mít proto co nejvíce pod kontrolou.

V částicové fyzice, kde obvykle zařizujeme srážky urychlených částic a studujeme částice vylétávající z těchto srážek, rozlišujeme dva základní typy pozadí. U prvního typu je koncový stav stejný jako v případě signálu a k jeho odlišení od signálu musíme obvykle použít důmyslná kinematická kritéria (rozdělení energií, hybností, úhlové závislosti ap.). Ve druhém případě je koncový stav různý, nicméně kvůli nedokonalostem v měření může vypadat stejně jako koncový stav sledovaného signálu. Jako příklad uveďme objev a měření Higgsova bosonu (H). Připomeňme, že existence Higgsova bosonu byla teoretiky předpověděna již v šedesátých letech 20. století, nicméně jeho existence byla potvrzena až v roce 2012 experimenty ATLAS a CMS na urychlovači LHC [4, 5].

My se soustředíme na pozdější objev Higgsova bosonu v rozpadu na pár tau-leptonů (τ) [6, 7, 8], tj. proces H → τ τ. První typ pozadí v tomto případě představuje především produkce bosonu Z (bosonu zprostředkovávajícího slabé interakce), který se také může rozpadnout na dvojici tau-leptonů, Z → τ τ. Toto měření je dále komplikováno skutečností, že i tau-lepton se velmi rychle rozpadá, a v experimentu proto pozorujeme pouze produkty jeho rozpadu. Výsledek tak může vypadat stejně jako jiné procesy, které také přispívají k pozadí. Příkladem budiž produkce páru top-antitop kvarků t t, kdy koncový stav může být prakticky stejný jako v případě signálu. Např. v rozpadu t t → WbWb → ℓνℓνbb jsou v koncovém stavu dva lehké nabité leptony (elektron nebo mion, souhrnně označené ℓ), stejně jako v případě leptonových rozpadů tau-leptonu H → τ τ → ℓνℓνντντ (tzv. plně leptonový kanál, označovaný také H → τlep τlep).

Podívejme se blíže na příspěvek od Z → τ τ. Zdálo by se, že rozlišit toto pozadí od signálu lze snadno tak, že v každém měřeném případu spočítáme hmotu rozpadající se částice (tzv. invariantní hmotu) ze změřených energií a hybností dceřiných částic, tedy obou tau-leptonů.1) Situace je však složitější kvůli rozpadům tau-leptonů, proto zmíněnou invariantní hmotu musíme určit z koncového stavu, tj. z produktů rozpadu obou tau-leptonů. Vzhledem k tomu, že mezi produkty rozpadu každého tau-leptonu musí být alespoň jedno neutrino (které ovšem nelze v takových experimentech přímo měřit), musíme použít nějakou přibližnou metodu. A každá taková aproximace nevyhnutelně znamená zhoršení rozlišení, tj. místo „úzkého píku“ se středem odpovídajícím hmotě daného bosonu naměříme pík výrazně širší. Obr. 2 ilustruje, jak bude vypadat spektrum invariantní hmoty Higgsova a Z-bosonu v jedné aproximaci. Vidíme, že píky se částečně překrývají. Další komplikací je skutečnost, že pravděpodobnost produkce Z-bosonu je mnohonásobně vyšší než produkce Higgsova bosonu, tzn. ve skutečnosti bude zelený pík výrazně vyšší než pík červený. Případy odpovídající rozpadu H → τ τ tak najdeme na „chvostu“ píku Z → τ τ, a je tedy zřejmé, že k nalezení signálu musíme znát pozadí velmi přesně.

Věrohodnost pozorování

Nezávisle na sobě experimenty ATLAS a CMS nedávno oznámily objev produkce dvou párů top-antitop kvarků s věrohodností 6,4σ a 5,5σ. Jedná se o pozorování procesu, jehož pravděpodobnost je ještě menší než produkce výše zmíněného Higgsova bosonu. Na obrázku je zobrazen jeden případ takové interakce z detektoru ATLAS – vidíme zde celkem 7 jetů, z toho 4 b-jety (modré kužely) a dále dva miony (červené dráhy) a jeden elektron (modrá dráha). Čárkovaně je vyznačena tzv. chybějící příčná energie, která indikuje přítomnost neutrin.

Co znamená ono podivné tvrzení o věrohodnosti, jsou si fyzici svým objevem jisti, nebo ne? V částicové fyzice se za objev konsenzuálně považuje pozorování určitého procesu či částice s věrohodností alespoň 5σ. Znamená to, že pravděpodobnost omylu, tedy toho, že by pozorování bylo jen výsledkem náhodné fluktuace pozadí bez skutečné přítomnosti hledaného procesu, je pouhých 3 ∙ 10–7. Matematicky je tato pravděpodobnost vyjádřena plochou pod Gaussovou křivkou daleko od jejího středu, v intervalu (střed + 5σ, ∞).

Zdroj: home.web.cern.ch/news/news/physics/atlas-and-cms-observe-simultaneous-production-four-top-quarks

Jak tedy co nejlépe předpovědět velikost a tvar spektra pozadí? Pozadí můžeme modelovat pomocí simulací Monte Carlo, kdy spojujeme simulace generátorů procesů (H, Z a jejich rozpadů a další přispívající procesy) a následnou simulaci chování jednotlivých částic (produktů rozpadu) v detektoru. Spoléhat pouze na čisté simulace Monte Carlo může být ošidné, proto se simulované výsledky vždy porovnávají s experimentálními daty v tzv. kontrolní oblasti. Stanovení příspěvku Z → τ τ je složité, proto se podívejme na stanovení komponenty t t v plně leptonovém kanále. Kontrolní oblast je obvykle definována stejnými výběrovými kritérii jako signální oblast s tím, že jedno z kritérií je obráceno. V našem případě obrátíme podmínku na přítomnost b-jetů2) v koncovém stavu, tj. požadujeme alespoň jeden b-jet. V kontrolní oblasti neočekáváme žádný signál H → τ τ, proto můžeme modelované pozadí přímo srovnat s experimentálními daty, jak je ukázáno na obr. 3. Případné nalezené odchylky pak můžeme zapracovat do korekcí pozadí v signální oblasti.

Tímto způsobem získáme informaci o chování jedné komponenty pozadí, podobným způsobem postupujeme i pro další významné komponenty (definice příslušné kontrolní oblasti, srovnání experimentálních dat se simulacemi Monte Carlo). Správné množství jednotlivých komponent pozadí (tj. normalizaci jednotlivých spekter) pak určíme z tzv. kombinovaného fitu na experimentální data, kdy současně fitujeme modelované tvary spekter jednotlivých komponent ve všech signálních a kontrolních oblastech najednou.3) Tím získáme výsledné „složení“ naměřených dat ve všech studovaných oblastech včetně té signální (obr. 4) a můžeme určit, zda „nadbytek“ případů odpovídá očekávanému signálu. Díky pečlivé analýze jednotlivých složek pozadí je celkové pozadí určeno velmi přesně, a tak i relativně malý nadbytek případů signálu může být statisticky signifikantní.

Pozorný čtenář si jistě všiml, že jedna z komponent pozadí na obr. 34 je označena podezřelým termínem špatně identifikované tau. Takové případy pocházejí z událostí, kdy je nějaký objekt chybně identifikován jako tau-lepton. Takovým příspěvkům prakticky nelze zabránit. Přestože identifikace každého objektu v detektoru je založena na více kritériích, vždy existuje jistá malá pravděpodobnost, že taková kritéria splní jiný druh objektu či částice. K určení této složky pozadí se používají výhradně data, nespoléháme zde tedy na simulace Monte Carlo. Tvar a množství takového příspěvku se opět určuje v kontrolní oblasti „obohacené“ speciálním výběrem o takto špatně identifikované případy. Vědci pak vyvinuli několik metod (např. maticovou metodu, metodu tzv. „fake“ faktorů), jak projektovat tyto případy do ostatních oblastí.

Jak jednoduché?

Šum v detektorech a procesy pozadí přispívající k měřenému signálu představují významné faktory ovlivňující prakticky každé měření v částicové fyzice. K úspěšnému měření musíme minimalizovat šum z jednotlivých částí detektoru a při analýze dat pak pečlivě studovat výběr případů a příspěvky konkurenčních procesů ke studovanému fyzikálnímu jevu. 

Poděkování: Děkuji kolegům J. Dolejšímu a V. Pleskotovi za cenné připomínky, které přispěly k vylepšení tohoto textu. Práce na experimentu ATLAS jsou podporovány projekty MŠMT – výzkumnou infrastrukturou CERN-CZ (projekty LM2018104 a LM2023040), sloužící jako hlavní platforma pro naši účast v experimentech v CERN, a projektem Inter-Excellence/Inter-Transfer LTT17018 podporujícím v letech 2018-2022 fyzikální analýzy nejen v experimentu ATLAS.

Autorská práva obrázků CERN ve prospěch kolaborace ATLAS. Licence CC BY 4.0, použito se svolením.

Poznámky

1) Hmoty obou bosonů jsou známy z jiných nezávislých měření, m(Z) = 91 GeV, m(H) = 125 GeV.

2) Jako b-jet označujeme spršku částic pocházející z hadronizace b-kvarku vzniklého buď přímo v primární interakci, či v rozpadech produktů primární interakce. Tak se děje právě v rozpadu páru t t, v jehož koncovém stavu jsou dva b-kvarky.

3) Situace je ve skutečnosti výrazně složitější, protože do hry vstupují také změny tvaru jednotlivých spekter v důsledku některých systematických neurčitostí (experimentálních i teoretických) a dále statistické neurčitosti. Na výše uvedeném základním principu se však nic nemění.

Ke stažení

TÉMA MĚSÍCE: Signál a šum
OBORY A KLÍČOVÁ SLOVA: Částicová fyzika, Fyzika

O autorovi

Tomáš Davídek

Doc. RNDr. Tomáš Davídek, Ph.D., (*1971) vystudoval Matematicko‑fyzikální fakultu UK v Praze. Po absolvování doktorského studia částicové fyziky pracoval dva roky v evropské laboratoři CERN. Je dlouholetým členem experimentu ATLAS, kde se věnuje zejména hadronovému kalorimetru Tilecal. Podílel se také na několika měřeních rozpadů Higgsova bosonu a na analýzách dalších fyzikálních procesů v tomto experimentu. Je vedoucím týmu ATLAS v Ústavu částicové a jaderné fyziky MFF UK.
Davídek Tomáš

Další články k tématu

Zvuk a jeho kvalityuzamčeno

Většina z nás žije celý život obklopena zvukem. Někdy by se chtělo říci hlukem, ale je zřejmé, že některé zvuky jsou pro nás žádoucí, ba i...

Jak řídit jaderný kompas?uzamčeno

Nukleární magnetická rezonance (NMR) je nepostradatelný nástroj pro studium látek všech skupenství. Propojuje v sobě fyziku, elektrotechniku,...

Data, signál a šum

Signál je informace, která nás zajímá. Informace, která nás nezajímá, je šum: pozadí, odpad a nepříjemnost. Jak se vlastně rozhodujeme, co je co?...

Hledání galaxií v kupce šumuuzamčeno

Analogová rádia byla kdysi téměř nepostradatelnou výbavou domácnosti. Před érou streamované hudby museli poslechuchtiví uživatelé naladit rádio...

Signál a šum v DNAuzamčeno

Genetická informace všech živých organismů, alespoň jak známe život tady a teď, je uložena v molekule DNA, deoxyribonukleové kyseliny. Abeceda DNA...

Doporučujeme

Genová terapie ALS: jsme na začátku naděje

Genová terapie ALS: jsme na začátku naděje

Je to krutá a zatím nevyléčitelná nemoc. Amyotrofická laterální skleróza. Americká léková agentura FDA však nedávno schválila pro medicínskou...
(Ne)umělá sladidla

(Ne)umělá sladidla uzamčeno

Adam Obr  |  3. 6. 2024
Když loni v létě zařadilo WHO aspartam na seznam látek, které mají potenciál způsobovat rakovinu, dosáhla diskuse o škodlivosti nekalorických...
Příběhy řasových éček

Příběhy řasových éček

Richard Lhotský  |  3. 6. 2024
Přídatné látky v potravinách, familiárně přezdívané pro svůj kód éčka, vzbuzují u řady lidí obavy a strach. Přesto se mezi nimi najdou i látky...