Aktuální číslo:

Signál a šum ve fyzice částic

| 29. 5. 2023

| Vesmír 102, 315, 2023/6

Ve vědách je šum – na rozdíl od české státní hymny – nežádoucím jevem provázejícím každé měření. Není to však jediná obtíž, s níž se musí experimentátor vyrovnat, jestliže chce z experimentu získat požadovanou informaci.

Oddělit co nejlépe signál od šumu je důležité ve všech odvětvích experimentální fyziky. Měření, která provádíme v částicové fyzice, jsou však natolik komplexní, že potřeba oddělit „zrno od plev“ vyvstává v různých úrovních měření a zpracování dat.

Komplexnost zmíněných měření si ilustrujme na situaci z „běžného života“. Někde pod širým nebem se koná koncert oblíbené hudební skupiny a my chceme zjistit, kolik našich známých se ho účastní. Jako detektor použijeme digitální fotoaparát. Jednotlivé pixely fotoaparátu detekují přicházející fotony. Čím více fotonů (tedy více světla), tím menší fluktuace, a tedy menší šum, který se na fotografii projeví jako menší zrnitost. Večer, při horších světelných podmínkách, sice můžeme prodloužit dobu expozice, ale posluchači se mohou hýbat a výsledný obrázek nemusí být dostatečně ostrý. Abychom mohli rozpoznat jednotlivé tváře, musíme optimalizovat poměr mezi dobou expozice a ostrostí snímku. Dalším krokem bude analýza získaných dat – tedy identifikace našich známých z pořízeného snímku. Při malém počtu účastníků můžeme snímek či snímky prohlížet osobně a sami hledat známé tváře, při velkém počtu účastníků patrně použijeme sofistikovanější metody na rozpoznání obrazu, včetně metod umělé inteligence. Podobně jako v částicové fyzice se musíme smířit s tím, že velikost daného signálu (zde počtu známých) bude mnohem menší než množství šumu (zde počet ostatních účastníků koncertu, kteří nás nezajímají).

Detektor

Šum vzniká v důsledku fyzikálních procesů v detektoru (např. tzv. temný proud ve fotonásobiči) či pochází z vyčítací elektroniky. Případné nedostatky lze pak jen velmi složitě, pokud vůbec, eliminovat na úrovni zpracování dat. Z tohoto důvodu je věnována velká péče designu jednotlivých detektorů a elektronických obvodů, které musí být dostatečně odolné a stabilní vůči vnějším podmínkám, jako je např. teplota, magnetické pole či radiační zátěž. Příprava experimentů je proto náročná a časově zdlouhavá záležitost, mimo jiné i proto, že jednotlivé komponenty detektorů je potřeba velmi pečlivě otestovat v různých extrémních podmínkách.

Schéma jednoho modulu hadronového kalorimetru Tilecal v experimentu ATLAS. Modul je složen ze střídajících se vrstev oceli a scintilátorů, umístěných v šachovnicové struktuře. Optický signál ze scintilátorů je vyčítán po obou stranách modulu světlovodnými vlákny s vlnovým posunem a veden k fotonásobičům umístěným spolu s vyčítací elektronikou ve vnější části modulu. Centrální část kalorimetru sestává ze 64 takových modulů, dohromady tvořících jakýsi dutý válec, v jehož vnitřní i vnější části jsou umístěny další detektory experimentu ATLAS.

Upraveno podle Eur. Phys. J. C 70, 1193, 2010, DOI: 10.1140/epjc/s10052-010-1508-y

Jako příklad zkoumání a snížení šumu uveďme hadronový kalorimetr Tilecal [1, 2] na experimentu ATLAS [3]. Kalorimetr je zařízení, jehož úkolem je měřit energii a směr všech primárních částic, které do kalorimetru přiletí a jsou v něm absorbovány. Primární částice interaguje s materiálem kalorimetru, a vytváří tak množství sekundárních částic – elektromagnetické či hadronové spršky. Aktivní detekční prvky měří signál od těchto sekundárních částic v různých vrstvách kalorimetru, celkový signál je pak úměrný energii primární částice.

Hadronový kalorimetr Tilecal sestává z ocelových desek sloužících jako absorbátor a ze scintilačních destiček v roli aktivních detekčních prvků (obr. 1). Část energie, kterou elektricky nabité sekundární částice zanechají ve scintilátoru, je vyzářena ve formě světla a toto světlo je pak po stranách scintilátorů sbíráno optickými vlákny a vedeno k fotonásobičům. Zde je přeměněno na elektrický signál, který je dále zpracováván poměrně složitou vyčítací elektronikou.

Při vývoji tohoto kalorimetru jsme řešili problém zvyšující se hladiny elektronického šumu v některých kanálech. Ukázalo se, že příčinou tohoto šumu jsou napájecí zdroje, umístěné v blízkosti vyčítací elektroniky. Čím blíže byla elektronika daného kanálu ke zdroji napětí, tím byl šum vyšší. Vhodnou úpravou zdrojů se pak podařilo tuto závislost z velké části eliminovat.

Invariantní hmota páru tau-leptonů rekonstruovaná pomocí aproximace MMC v rozpadech Z → ꚍ ꚍ (zelená) a H → ꚍ ꚍ (červená). Obrázek byl získán výhradně pomocí simulací Monte Carlo a kombinuje všechny možné rozpadové kanály tau-leptonu. Obě spektra jsou normalizována.

Podle Phys. Rev.D99, 072001, 2019, DOI: 10.1103/PhysRevD.99.072001

Analýza dat

Při vlastním měření určitého fyzikálního procesu se setkáváme s jiným problémem. Procesy, které chceme proměřit nebo jejichž existenci chceme potvrdit, jsou obvykle velmi vzácné vzhledem k ostatním již známým procesům. Poměr pravděpodobností výskytu sledovaného procesu (signálu) vůči ostatním konkurenčním procesům (označujeme je souhrnně jako pozadí) může být i mnoho řádů, jde tedy opravdu o hledání příslovečné jehly v kupce sena. Abychom mohli signál v takové záplavě pozadí objevit, potřebujeme velký vzorek experimentálních dat a dále je nutné pozadí co nejvíce eliminovat vhodným výběrem proběhlých událostí (srážek). Přesto se pozadí nikdy zcela nezbavíme, a musíme ho mít proto co nejvíce pod kontrolou.

V částicové fyzice, kde obvykle zařizujeme srážky urychlených částic a studujeme částice vylétávající z těchto srážek, rozlišujeme dva základní typy pozadí. U prvního typu je koncový stav stejný jako v případě signálu a k jeho odlišení od signálu musíme obvykle použít důmyslná kinematická kritéria (rozdělení energií, hybností, úhlové závislosti ap.). Ve druhém případě je koncový stav různý, nicméně kvůli nedokonalostem v měření může vypadat stejně jako koncový stav sledovaného signálu. Jako příklad uveďme objev a měření Higgsova bosonu (H). Připomeňme, že existence Higgsova bosonu byla teoretiky předpověděna již v šedesátých letech 20. století, nicméně jeho existence byla potvrzena až v roce 2012 experimenty ATLAS a CMS na urychlovači LHC [4, 5].

My se soustředíme na pozdější objev Higgsova bosonu v rozpadu na pár tau-leptonů (τ) [6, 7, 8], tj. proces H → τ τ. První typ pozadí v tomto případě představuje především produkce bosonu Z (bosonu zprostředkovávajícího slabé interakce), který se také může rozpadnout na dvojici tau-leptonů, Z → τ τ. Toto měření je dále komplikováno skutečností, že i tau-lepton se velmi rychle rozpadá, a v experimentu proto pozorujeme pouze produkty jeho rozpadu. Výsledek tak může vypadat stejně jako jiné procesy, které také přispívají k pozadí. Příkladem budiž produkce páru top-antitop kvarků t t, kdy koncový stav může být prakticky stejný jako v případě signálu. Např. v rozpadu t t → WbWb → ℓνℓνbb jsou v koncovém stavu dva lehké nabité leptony (elektron nebo mion, souhrnně označené ℓ), stejně jako v případě leptonových rozpadů tau-leptonu H → τ τ → ℓνℓνν_τν_τ (tzv. plně leptonový kanál, označovaný také H → τ_lep τ_lep).

Invariantní hmota páru tau-leptonů rekonstruovaná pomocí aproximace MMC v tzv. kontrolní oblasti pro pozadí z produkce páru top-antitop kvarků t t (top KO) v plně leptonovém kanále. Obrázek srovnává naměřená data s předpokládaným příspěvkem jednotlivých složek pozadí získaných pomocí simulací Monte Carlo. V této oblasti dominuje složka t t, nicméně započítat musíme i příspěvky od ostatních komponent.

Upraveno podle M. Aaboud et al.: Phys. Rev. D 99, 072001, 2019, DOI: 10.1103/PhysRevD.99.072001

Podívejme se blíže na příspěvek od Z → τ τ. Zdálo by se, že rozlišit toto pozadí od signálu lze snadno tak, že v každém měřeném případu spočítáme hmotu rozpadající se částice (tzv. invariantní hmotu) ze změřených energií a hybností dceřiných částic, tedy obou tau-leptonů.¹⁾ Situace je však složitější kvůli rozpadům tau-leptonů, proto zmíněnou invariantní hmotu musíme určit z koncového stavu, tj. z produktů rozpadu obou tau-leptonů. Vzhledem k tomu, že mezi produkty rozpadu každého tau-leptonu musí být alespoň jedno neutrino (které ovšem nelze v takových experimentech přímo měřit), musíme použít nějakou přibližnou metodu. A každá taková aproximace nevyhnutelně znamená zhoršení rozlišení, tj. místo „úzkého píku“ se středem odpovídajícím hmotě daného bosonu naměříme pík výrazně širší. Obr. 2 ilustruje, jak bude vypadat spektrum invariantní hmoty Higgsova a Z-bosonu v jedné aproximaci. Vidíme, že píky se částečně překrývají. Další komplikací je skutečnost, že pravděpodobnost produkce Z-bosonu je mnohonásobně vyšší než produkce Higgsova bosonu, tzn. ve skutečnosti bude zelený pík výrazně vyšší než pík červený. Případy odpovídající rozpadu H → τ τ tak najdeme na „chvostu“ píku Z → τ τ, a je tedy zřejmé, že k nalezení signálu musíme znát pozadí velmi přesně.

Obrázek převzat z atlas.cern/Updates/Physics-Briefing/observation-4tops

Věrohodnost pozorování

Nezávisle na sobě experimenty ATLAS a CMS nedávno oznámily objev produkce dvou párů top-antitop kvarků s věrohodností 6,4σ a 5,5σ. Jedná se o pozorování procesu, jehož pravděpodobnost je ještě menší než produkce výše zmíněného Higgsova bosonu. Na obrázku je zobrazen jeden případ takové interakce z detektoru ATLAS – vidíme zde celkem 7 jetů, z toho 4 b-jety (modré kužely) a dále dva miony (červené dráhy) a jeden elektron (modrá dráha). Čárkovaně je vyznačena tzv. chybějící příčná energie, která indikuje přítomnost neutrin.

Co znamená ono podivné tvrzení o věrohodnosti, jsou si fyzici svým objevem jisti, nebo ne? V částicové fyzice se za objev konsenzuálně považuje pozorování určitého procesu či částice s věrohodností alespoň 5σ. Znamená to, že pravděpodobnost omylu, tedy toho, že by pozorování bylo jen výsledkem náhodné fluktuace pozadí bez skutečné přítomnosti hledaného procesu, je pouhých 3 ∙ 10^–7. Matematicky je tato pravděpodobnost vyjádřena plochou pod Gaussovou křivkou daleko od jejího středu, v intervalu (střed + 5σ, ∞).

Zdroj: home.web.cern.ch/news/news/physics/atlas-and-cms-observe-simultaneous-production-four-top-quarks

Jak tedy co nejlépe předpovědět velikost a tvar spektra pozadí? Pozadí můžeme modelovat pomocí simulací Monte Carlo, kdy spojujeme simulace generátorů procesů (H, Z a jejich rozpadů a další přispívající procesy) a následnou simulaci chování jednotlivých částic (produktů rozpadu) v detektoru. Spoléhat pouze na čisté simulace Monte Carlo může být ošidné, proto se simulované výsledky vždy porovnávají s experimentálními daty v tzv. kontrolní oblasti. Stanovení příspěvku Z → τ τ je složité, proto se podívejme na stanovení komponenty t t v plně leptonovém kanále. Kontrolní oblast je obvykle definována stejnými výběrovými kritérii jako signální oblast s tím, že jedno z kritérií je obráceno. V našem případě obrátíme podmínku na přítomnost b-jetů²⁾ v koncovém stavu, tj. požadujeme alespoň jeden b-jet. V kontrolní oblasti neočekáváme žádný signál H → τ τ, proto můžeme modelované pozadí přímo srovnat s experimentálními daty, jak je ukázáno na obr. 3. Případné nalezené odchylky pak můžeme zapracovat do korekcí pozadí v signální oblasti.

Invariantní hmota páru tau-leptonů rekonstruovaná pomocí aproximace MMC. Výběr událostí v signální oblasti (SO) je cílen na změření rozpadů H → τ τ. Hlavní složkou pozadí je rozpad Z → τ τ. Spodní část obrázku ukazuje rozdíl naměřených dat a očekávaného pozadí. Je zde vidět statisticky signifikantní nadbytek případů, který dobře odpovídá očekávanému tvaru i množství signálu H → τ τ.

Upraveno podle M. Aaboud et al.: Phys. Rev. D 99, 072001, 2019, DOI: 10.1103/PhysRevD.99.072001

Tímto způsobem získáme informaci o chování jedné komponenty pozadí, podobným způsobem postupujeme i pro další významné komponenty (definice příslušné kontrolní oblasti, srovnání experimentálních dat se simulacemi Monte Carlo). Správné množství jednotlivých komponent pozadí (tj. normalizaci jednotlivých spekter) pak určíme z tzv. kombinovaného fitu na experimentální data, kdy současně fitujeme modelované tvary spekter jednotlivých komponent ve všech signálních a kontrolních oblastech najednou.³⁾ Tím získáme výsledné „složení“ naměřených dat ve všech studovaných oblastech včetně té signální (obr. 4) a můžeme určit, zda „nadbytek“ případů odpovídá očekávanému signálu. Díky pečlivé analýze jednotlivých složek pozadí je celkové pozadí určeno velmi přesně, a tak i relativně malý nadbytek případů signálu může být statisticky signifikantní.

Pozorný čtenář si jistě všiml, že jedna z komponent pozadí na obr. 3 a 4 je označena podezřelým termínem špatně identifikované tau. Takové případy pocházejí z událostí, kdy je nějaký objekt chybně identifikován jako tau-lepton. Takovým příspěvkům prakticky nelze zabránit. Přestože identifikace každého objektu v detektoru je založena na více kritériích, vždy existuje jistá malá pravděpodobnost, že taková kritéria splní jiný druh objektu či částice. K určení této složky pozadí se používají výhradně data, nespoléháme zde tedy na simulace Monte Carlo. Tvar a množství takového příspěvku se opět určuje v kontrolní oblasti „obohacené“ speciálním výběrem o takto špatně identifikované případy. Vědci pak vyvinuli několik metod (např. maticovou metodu, metodu tzv. „fake“ faktorů), jak projektovat tyto případy do ostatních oblastí.

Jak jednoduché?

Šum v detektorech a procesy pozadí přispívající k měřenému signálu představují významné faktory ovlivňující prakticky každé měření v částicové fyzice. K úspěšnému měření musíme minimalizovat šum z jednotlivých částí detektoru a při analýze dat pak pečlivě studovat výběr případů a příspěvky konkurenčních procesů ke studovanému fyzikálnímu jevu.

Poděkování: Děkuji kolegům J. Dolejšímu a V. Pleskotovi za cenné připomínky, které přispěly k vylepšení tohoto textu. Práce na experimentu ATLAS jsou podporovány projekty MŠMT – výzkumnou infrastrukturou CERN-CZ (projekty LM2018104 a LM2023040), sloužící jako hlavní platforma pro naši účast v experimentech v CERN, a projektem Inter-Excellence/Inter-Transfer LTT17018 podporujícím v letech 2018-2022 fyzikální analýzy nejen v experimentu ATLAS.

Autorská práva obrázků CERN ve prospěch kolaborace ATLAS. Licence CC BY 4.0, použito se svolením.

Poznámky

1) Hmoty obou bosonů jsou známy z jiných nezávislých měření, m(Z) = 91 GeV, m(H) = 125 GeV.

2) Jako b-jet označujeme spršku částic pocházející z hadronizace b-kvarku vzniklého buď přímo v primární interakci, či v rozpadech produktů primární interakce. Tak se děje právě v rozpadu páru t t, v jehož koncovém stavu jsou dva b-kvarky.

3) Situace je ve skutečnosti výrazně složitější, protože do hry vstupují také změny tvaru jednotlivých spekter v důsledku některých systematických neurčitostí (experimentálních i teoretických) a dále statistické neurčitosti. Na výše uvedeném základním principu se však nic nemění.

Literatura

[1] ATLAS Collaboration, Readiness of the ATLAS Tile Calorimeter for LHC collisions, Eur. Phys. J. C70 (2010) 1193

[2] ATLAS Collaboration, Operation and performance of the ATLAS Tile Calorimeter in Run 1, Eur. Phys. J. C78 (2018) 987

[3] ATLAS Collaboration, The ATLAS experiment at the CERN Large Hadron Collider, J. Instrum. 3, S08003 (2008)

[4] https://atlas.cern/Discover/Physics/Higgs

[5] https://cms.cern/physics/higgs-boson

[6] Evidence for Higgs boson Yukawa couplings in the H → τ τ decay mode with the ATLAS detector, J. High Energy Phys. 04 (2015) 117; DOI: 10.1007/JHEP04(2015)117

[7] Cross-section measurements of the Higgs boson decaying into a pair of tau-leptons in proton-proton collisions at √s=13 TeV with the ATLAS detector, Phys. Rev. D 99 (2019), 072001; 10.1103/PhysRevD.99.072001

[8] Measurements of Higgs boson production cross-sections in the H→τ+τ− decay channel in pp collisions at √s=13TeV with the ATLAS detector, J. High Energy Phys. 08 (2022) 175; DOI: 10.1007/JHEP08(2022)175
[MMC] A. Elagin, P. Murat, A. Pranko, and A. Safonov, A new mass reconstruction technique for resonances decaying to ττ, Nucl. Instrum. Methods Phys. Res., Sect. A 654, 481 (2011); DOI: 10.1016/nima.2011.07.009

[Web] https://atlas.web.cern.ch/Atlas/GROUPS/PHYSICS/PAPERS/HIGG-2017-07/

Ke stažení

článek ve formátu pdf [779,25 kB]

TÉMA MĚSÍCE: Signál a šum

OBORY A KLÍČOVÁ SLOVA: Částicová fyzika, Fyzika

RUBRIKA: Hlavní články

O autorovi

Tomáš Davídek

Doc. RNDr. Tomáš Davídek, Ph.D., (*1971) vystudoval Matematicko‑fyzikální fakultu UK v Praze. Po absolvování doktorského studia částicové fyziky pracoval dva roky v evropské laboratoři CERN. Je dlouholetým členem experimentu ATLAS, kde se věnuje zejména hadronovému kalorimetru Tilecal. Podílel se také na několika měřeních rozpadů Higgsova bosonu a na analýzách dalších fyzikálních procesů v tomto experimentu. Je vedoucím týmu ATLAS v Ústavu částicové a jaderné fyziky MFF UK.

články autora