Signál a šum ve fyzice částic
| 29. 5. 2023Ve vědách je šum – na rozdíl od české státní hymny – nežádoucím jevem provázejícím každé měření. Není to však jediná obtíž, s níž se musí experimentátor vyrovnat, jestliže chce z experimentu získat požadovanou informaci.
Oddělit co nejlépe signál od šumu je důležité ve všech odvětvích experimentální fyziky. Měření, která provádíme v částicové fyzice, jsou však natolik komplexní, že potřeba oddělit „zrno od plev“ vyvstává v různých úrovních měření a zpracování dat.
Komplexnost zmíněných měření si ilustrujme na situaci z „běžného života“. Někde pod širým nebem se koná koncert oblíbené hudební skupiny a my chceme zjistit, kolik našich známých se ho účastní. Jako detektor použijeme digitální fotoaparát. Jednotlivé pixely fotoaparátu detekují přicházející fotony. Čím více fotonů (tedy více světla), tím menší fluktuace, a tedy menší šum, který se na fotografii projeví jako menší zrnitost. Večer, při horších světelných podmínkách, sice můžeme prodloužit dobu expozice, ale posluchači se mohou hýbat a výsledný obrázek nemusí být dostatečně ostrý. Abychom mohli rozpoznat jednotlivé tváře, musíme optimalizovat poměr mezi dobou expozice a ostrostí snímku. Dalším krokem bude analýza získaných dat – tedy identifikace našich známých z pořízeného snímku. Při malém počtu účastníků můžeme snímek či snímky prohlížet osobně a sami hledat známé tváře, při velkém počtu účastníků patrně použijeme sofistikovanější metody na rozpoznání obrazu, včetně metod umělé inteligence. Podobně jako v částicové fyzice se musíme smířit s tím, že velikost daného signálu (zde počtu známých) bude mnohem menší než množství šumu (zde počet ostatních účastníků koncertu, kteří nás nezajímají).
Detektor
Šum vzniká v důsledku fyzikálních procesů v detektoru (např. tzv. temný proud ve fotonásobiči) či pochází z vyčítací elektroniky. Případné nedostatky lze pak jen velmi složitě, pokud vůbec, eliminovat na úrovni zpracování dat. Z tohoto důvodu je věnována velká péče designu jednotlivých detektorů a elektronických obvodů, které musí být dostatečně odolné a stabilní vůči vnějším podmínkám, jako je např. teplota, magnetické pole či radiační zátěž. Příprava experimentů je proto náročná a časově zdlouhavá záležitost, mimo jiné i proto, že jednotlivé komponenty detektorů je potřeba velmi pečlivě otestovat v různých extrémních podmínkách.
Jako příklad zkoumání a snížení šumu uveďme hadronový kalorimetr Tilecal [1, 2] na experimentu ATLAS [3]. Kalorimetr je zařízení, jehož úkolem je měřit energii a směr všech primárních částic, které do kalorimetru přiletí a jsou v něm absorbovány. Primární částice interaguje s materiálem kalorimetru, a vytváří tak množství sekundárních částic – elektromagnetické či hadronové spršky. Aktivní detekční prvky měří signál od těchto sekundárních částic v různých vrstvách kalorimetru, celkový signál je pak úměrný energii primární částice.
Hadronový kalorimetr Tilecal sestává z ocelových desek sloužících jako absorbátor a ze scintilačních destiček v roli aktivních detekčních prvků (obr. 1). Část energie, kterou elektricky nabité sekundární částice zanechají ve scintilátoru, je vyzářena ve formě světla a toto světlo je pak po stranách scintilátorů sbíráno optickými vlákny a vedeno k fotonásobičům. Zde je přeměněno na elektrický signál, který je dále zpracováván poměrně složitou vyčítací elektronikou.
Při vývoji tohoto kalorimetru jsme řešili problém zvyšující se hladiny elektronického šumu v některých kanálech. Ukázalo se, že příčinou tohoto šumu jsou napájecí zdroje, umístěné v blízkosti vyčítací elektroniky. Čím blíže byla elektronika daného kanálu ke zdroji napětí, tím byl šum vyšší. Vhodnou úpravou zdrojů se pak podařilo tuto závislost z velké části eliminovat.
Analýza dat
Při vlastním měření určitého fyzikálního procesu se setkáváme s jiným problémem. Procesy, které chceme proměřit nebo jejichž existenci chceme potvrdit, jsou obvykle velmi vzácné vzhledem k ostatním již známým procesům. Poměr pravděpodobností výskytu sledovaného procesu (signálu) vůči ostatním konkurenčním procesům (označujeme je souhrnně jako pozadí) může být i mnoho řádů, jde tedy opravdu o hledání příslovečné jehly v kupce sena. Abychom mohli signál v takové záplavě pozadí objevit, potřebujeme velký vzorek experimentálních dat a dále je nutné pozadí co nejvíce eliminovat vhodným výběrem proběhlých událostí (srážek). Přesto se pozadí nikdy zcela nezbavíme, a musíme ho mít proto co nejvíce pod kontrolou.
V částicové fyzice, kde obvykle zařizujeme srážky urychlených částic a studujeme částice vylétávající z těchto srážek, rozlišujeme dva základní typy pozadí. U prvního typu je koncový stav stejný jako v případě signálu a k jeho odlišení od signálu musíme obvykle použít důmyslná kinematická kritéria (rozdělení energií, hybností, úhlové závislosti ap.). Ve druhém případě je koncový stav různý, nicméně kvůli nedokonalostem v měření může vypadat stejně jako koncový stav sledovaného signálu. Jako příklad uveďme objev a měření Higgsova bosonu (H). Připomeňme, že existence Higgsova bosonu byla teoretiky předpověděna již v šedesátých letech 20. století, nicméně jeho existence byla potvrzena až v roce 2012 experimenty ATLAS a CMS na urychlovači LHC [4, 5].
My se soustředíme na pozdější objev Higgsova bosonu v rozpadu na pár tau-leptonů (τ) [6, 7, 8], tj. proces H → τ τ. První typ pozadí v tomto případě představuje především produkce bosonu Z (bosonu zprostředkovávajícího slabé interakce), který se také může rozpadnout na dvojici tau-leptonů, Z → τ τ. Toto měření je dále komplikováno skutečností, že i tau-lepton se velmi rychle rozpadá, a v experimentu proto pozorujeme pouze produkty jeho rozpadu. Výsledek tak může vypadat stejně jako jiné procesy, které také přispívají k pozadí. Příkladem budiž produkce páru top-antitop kvarků t t, kdy koncový stav může být prakticky stejný jako v případě signálu. Např. v rozpadu t t → WbWb → ℓνℓνbb jsou v koncovém stavu dva lehké nabité leptony (elektron nebo mion, souhrnně označené ℓ), stejně jako v případě leptonových rozpadů tau-leptonu H → τ τ → ℓνℓνντντ (tzv. plně leptonový kanál, označovaný také H → τlep τlep).
Podívejme se blíže na příspěvek od Z → τ τ. Zdálo by se, že rozlišit toto pozadí od signálu lze snadno tak, že v každém měřeném případu spočítáme hmotu rozpadající se částice (tzv. invariantní hmotu) ze změřených energií a hybností dceřiných částic, tedy obou tau-leptonů.1) Situace je však složitější kvůli rozpadům tau-leptonů, proto zmíněnou invariantní hmotu musíme určit z koncového stavu, tj. z produktů rozpadu obou tau-leptonů. Vzhledem k tomu, že mezi produkty rozpadu každého tau-leptonu musí být alespoň jedno neutrino (které ovšem nelze v takových experimentech přímo měřit), musíme použít nějakou přibližnou metodu. A každá taková aproximace nevyhnutelně znamená zhoršení rozlišení, tj. místo „úzkého píku“ se středem odpovídajícím hmotě daného bosonu naměříme pík výrazně širší. Obr. 2 ilustruje, jak bude vypadat spektrum invariantní hmoty Higgsova a Z-bosonu v jedné aproximaci. Vidíme, že píky se částečně překrývají. Další komplikací je skutečnost, že pravděpodobnost produkce Z-bosonu je mnohonásobně vyšší než produkce Higgsova bosonu, tzn. ve skutečnosti bude zelený pík výrazně vyšší než pík červený. Případy odpovídající rozpadu H → τ τ tak najdeme na „chvostu“ píku Z → τ τ, a je tedy zřejmé, že k nalezení signálu musíme znát pozadí velmi přesně.
Věrohodnost pozorování
Nezávisle na sobě experimenty ATLAS a CMS nedávno oznámily objev produkce dvou párů top-antitop kvarků s věrohodností 6,4σ a 5,5σ. Jedná se o pozorování procesu, jehož pravděpodobnost je ještě menší než produkce výše zmíněného Higgsova bosonu. Na obrázku je zobrazen jeden případ takové interakce z detektoru ATLAS – vidíme zde celkem 7 jetů, z toho 4 b-jety (modré kužely) a dále dva miony (červené dráhy) a jeden elektron (modrá dráha). Čárkovaně je vyznačena tzv. chybějící příčná energie, která indikuje přítomnost neutrin.
Co znamená ono podivné tvrzení o věrohodnosti, jsou si fyzici svým objevem jisti, nebo ne? V částicové fyzice se za objev konsenzuálně považuje pozorování určitého procesu či částice s věrohodností alespoň 5σ. Znamená to, že pravděpodobnost omylu, tedy toho, že by pozorování bylo jen výsledkem náhodné fluktuace pozadí bez skutečné přítomnosti hledaného procesu, je pouhých 3 ∙ 10–7. Matematicky je tato pravděpodobnost vyjádřena plochou pod Gaussovou křivkou daleko od jejího středu, v intervalu (střed + 5σ, ∞).
Zdroj: home.web.cern.ch/news/news/physics/atlas-and-cms-observe-simultaneous-production-four-top-quarks
Jak tedy co nejlépe předpovědět velikost a tvar spektra pozadí? Pozadí můžeme modelovat pomocí simulací Monte Carlo, kdy spojujeme simulace generátorů procesů (H, Z a jejich rozpadů a další přispívající procesy) a následnou simulaci chování jednotlivých částic (produktů rozpadu) v detektoru. Spoléhat pouze na čisté simulace Monte Carlo může být ošidné, proto se simulované výsledky vždy porovnávají s experimentálními daty v tzv. kontrolní oblasti. Stanovení příspěvku Z → τ τ je složité, proto se podívejme na stanovení komponenty t t v plně leptonovém kanále. Kontrolní oblast je obvykle definována stejnými výběrovými kritérii jako signální oblast s tím, že jedno z kritérií je obráceno. V našem případě obrátíme podmínku na přítomnost b-jetů2) v koncovém stavu, tj. požadujeme alespoň jeden b-jet. V kontrolní oblasti neočekáváme žádný signál H → τ τ, proto můžeme modelované pozadí přímo srovnat s experimentálními daty, jak je ukázáno na obr. 3. Případné nalezené odchylky pak můžeme zapracovat do korekcí pozadí v signální oblasti.
Tímto způsobem získáme informaci o chování jedné komponenty pozadí, podobným způsobem postupujeme i pro další významné komponenty (definice příslušné kontrolní oblasti, srovnání experimentálních dat se simulacemi Monte Carlo). Správné množství jednotlivých komponent pozadí (tj. normalizaci jednotlivých spekter) pak určíme z tzv. kombinovaného fitu na experimentální data, kdy současně fitujeme modelované tvary spekter jednotlivých komponent ve všech signálních a kontrolních oblastech najednou.3) Tím získáme výsledné „složení“ naměřených dat ve všech studovaných oblastech včetně té signální (obr. 4) a můžeme určit, zda „nadbytek“ případů odpovídá očekávanému signálu. Díky pečlivé analýze jednotlivých složek pozadí je celkové pozadí určeno velmi přesně, a tak i relativně malý nadbytek případů signálu může být statisticky signifikantní.
Pozorný čtenář si jistě všiml, že jedna z komponent pozadí na obr. 3 a 4 je označena podezřelým termínem špatně identifikované tau. Takové případy pocházejí z událostí, kdy je nějaký objekt chybně identifikován jako tau-lepton. Takovým příspěvkům prakticky nelze zabránit. Přestože identifikace každého objektu v detektoru je založena na více kritériích, vždy existuje jistá malá pravděpodobnost, že taková kritéria splní jiný druh objektu či částice. K určení této složky pozadí se používají výhradně data, nespoléháme zde tedy na simulace Monte Carlo. Tvar a množství takového příspěvku se opět určuje v kontrolní oblasti „obohacené“ speciálním výběrem o takto špatně identifikované případy. Vědci pak vyvinuli několik metod (např. maticovou metodu, metodu tzv. „fake“ faktorů), jak projektovat tyto případy do ostatních oblastí.
Jak jednoduché?
Šum v detektorech a procesy pozadí přispívající k měřenému signálu představují významné faktory ovlivňující prakticky každé měření v částicové fyzice. K úspěšnému měření musíme minimalizovat šum z jednotlivých částí detektoru a při analýze dat pak pečlivě studovat výběr případů a příspěvky konkurenčních procesů ke studovanému fyzikálnímu jevu.
Poděkování: Děkuji kolegům J. Dolejšímu a V. Pleskotovi za cenné připomínky, které přispěly k vylepšení tohoto textu. Práce na experimentu ATLAS jsou podporovány projekty MŠMT – výzkumnou infrastrukturou CERN-CZ (projekty LM2018104 a LM2023040), sloužící jako hlavní platforma pro naši účast v experimentech v CERN, a projektem Inter-Excellence/Inter-Transfer LTT17018 podporujícím v letech 2018-2022 fyzikální analýzy nejen v experimentu ATLAS.
Autorská práva obrázků CERN ve prospěch kolaborace ATLAS. Licence CC BY 4.0, použito se svolením.
Poznámky
1) Hmoty obou bosonů jsou známy z jiných nezávislých měření, m(Z) = 91 GeV, m(H) = 125 GeV.
2) Jako b-jet označujeme spršku částic pocházející z hadronizace b-kvarku vzniklého buď přímo v primární interakci, či v rozpadech produktů primární interakce. Tak se děje právě v rozpadu páru t t, v jehož koncovém stavu jsou dva b-kvarky.
3) Situace je ve skutečnosti výrazně složitější, protože do hry vstupují také změny tvaru jednotlivých spekter v důsledku některých systematických neurčitostí (experimentálních i teoretických) a dále statistické neurčitosti. Na výše uvedeném základním principu se však nic nemění.
Literatura
[1] ATLAS Collaboration, Readiness of the ATLAS Tile Calorimeter for LHC collisions, Eur. Phys. J. C70 (2010) 1193
[2] ATLAS Collaboration, Operation and performance of the ATLAS Tile Calorimeter in Run 1, Eur. Phys. J. C78 (2018) 987
[3] ATLAS Collaboration, The ATLAS experiment at the CERN Large Hadron Collider, J. Instrum. 3, S08003 (2008)
[4] https://atlas.cern/Discover/Physics/Higgs
[5] https://cms.cern/physics/higgs-boson
[6] Evidence for Higgs boson Yukawa couplings in the H → τ τ decay mode with the ATLAS detector, J. High Energy Phys. 04 (2015) 117; DOI: 10.1007/JHEP04(2015)117
[7] Cross-section measurements of the Higgs boson decaying into a pair of tau-leptons in proton-proton collisions at √s=13 TeV with the ATLAS detector, Phys. Rev. D 99 (2019), 072001; 10.1103/PhysRevD.99.072001
[8] Measurements of Higgs boson production cross-sections in the H→τ+τ− decay channel in pp collisions at √s=13TeV with the ATLAS detector, J. High Energy Phys. 08 (2022) 175; DOI: 10.1007/JHEP08(2022)175
[MMC] A. Elagin, P. Murat, A. Pranko, and A. Safonov, A new mass reconstruction technique for resonances decaying to ττ, Nucl. Instrum. Methods Phys. Res., Sect. A 654, 481 (2011); DOI: 10.1016/nima.2011.07.009
[Web] https://atlas.web.cern.ch/Atlas/GROUPS/PHYSICS/PAPERS/HIGG-2017-07/
Ke stažení
- článek ve formátu pdf [779,25 kB]