Aldebaran bulletin

Týdeník věnovaný aktualitám a novinkám z fyziky a astronomie.
Vydavatel: AGA (Aldebaran Group for Astrophysics)
Číslo 3 – vyšlo 20. ledna, ročník 15 (2017)
© Copyright Aldebaran Group for Astrophysics
Publikování nebo šíření obsahu je zakázáno.
ISSN: 1214-1674,
Email: bulletin@aldebaran.cz

Hledej

Plastická hmota – nové datové úložiště?

David Břeň

Každý, kdo již nějaký čas používá internet, si jistě všímá, že doba, kdy převládaly zprávy, novinky a odborné články, je dávno pryč a možná se i zamýšlí nad tím, že dnes, kdy je na Všesvětové Síti kdekým umisťován i ten sebevětší nesmysl, pomalu nastává a v budoucnu jednou musí nastat problém, kam všechna ta data umístit. Reza Zadegan ze Státní univerzity v Idahu se zabývá novými možnostmi uchovávání datových souborů a tvrdí, že vzhledem k tomu, že všechna světová data rostou rychleji než velikost úložišť, by kolem roku 2040 byl potřebný prostor křemíkových čipů plošně srovnatelný s velikostí menšího státu – například s Maltou.

Digitální svět

Jen těžko lze odhadnout další vývoj digitálního světa, který nás pohlcuje
zrychlujícím se tempem. Zdroj: ESNI Business School.

bit – základní jednotka klasické informace, která nabývá dvou hodnot (ano/ne), (0/1), (pravda/nepravda) atd. Násobnou jednotkou je kilobit označující 210 = 1024 možností. Termín zavedl Claude Elwood Shanon coby zkratku anglického termínu binary digit. Fyzikální realizace bitu si žádá systém se dvěma dobře definovanými stavy – například logický obvod bez napětí a s napětím.

byte – bajt, jednotka informace, která označuje osm bitů, tj. osmiciferné binární číslo. Takové množství informace může reprezentovat například celé číslo od 0 do 255 nebo jeden znak abecedy. Jeden byte je obvykle nejmenší objem dat, se kterým dokáže procesor přímo pracovat. Větší jednotky: kilobajt (kB, 210 = 1024 bytů), megabajt (MB, 1024*1024 bytů), gigabajt (GB, 10243 bytů), terabajt (TB, 10244 bytů).

Binární násobky – ve výpočetní technice se z technických důvodů používají paměti o velikostech rovných násobkům dvou. Při označování velikostí se vžily předpony používané v SI (kilo, mega, giga, tera). Ty však v tomto kontextu nejsou dekadické. Pro rozlišení v textu by se názvy měly správně doplňovat o malé písmeno i a psát jako kibi (KiB, 210), mebi (MiB, 220), gibi (GiB, 230) a tebi (TiB, 240). V praxi to ale dělá málokdo.

Od DNA k plastům

Reza Zadegan je jedním z mnoha, kteří hledají nové cesty uchovávání dat. Jednou z možností je uložení informací v DNADNA – Deoxyribonucleic acid, deoxyribonukleová kyselina. Jde o nukleovou kyselinu, jejíž cukernou složkou je 2'-deoxyribóza. Báze jsou tvořeny především čtveřicí adenin, thymin, guanin a cytosin; vzájemně komplementární jsou nukleotidy s adeninem a thyminem, a nukleotidy s cytosinem a guaninem. DNA vytváří dvoušroubovici z navzájem komplementárních opačně orientovaných řetězců, pracovního a paměťového. Její hlavní funkcí je uchovávání genetické informace.. Již v roce 2010 se týmu pod vedením George Churche z Wyssova institutu Harvardovy univerzity podařilo zakódovat knihu obsahující 53 400 slov, 11 obrázků a program v JavaScriptu (dohromady zhruba 5 milionů bitů dat) právě do sekvencí DNA. DNA tak ukázala, že je možné v malém objemu uchovat miliony bitů informací. Jenže DNA je křehká a není úplně jednoduché na ni zapisovat a následně z ní číst. Technologii uchovávání dat v molekulách DNA v současnosti intenzivně zkoumají na Washingtonské univerzitě a ve výzkumu vidí velkou budoucnost společnost Microsoft.

Společnost Microsoft úspšně uložila do DNA vláken videoklip.
Zdroj: Geo Beats. (mp4/h264, 14 MB)

Jinou cestou se vydal Jean-François Lutz z Institutu Charlese Sadrona ve francouzském Štrasburku. Začal experimentovat s řetězci tvořenými molekulami plastů. Do nich lze zakódovat informace obdobně jako do vláken DNA. Výzkumníci zakódovali text do krátkých řetězců molekul polymeru. Mohl by to být způsob, jak umožnit (prostorově) úsporně uložit množství údajů nebo například odhalit padělané zboží.

Řetězce polymerů mohou sloužit jako 0 nebo 1 digitálního počítačového kódu. Při předchozích výzkumech byla data ukládána v jednotlivých dlouhých řetězcích, které však bylo s jejich rostoucí délkou stále obtížnější číst. Lutzův tým zvolil jiný přístup. Namísto ukládání informací do dlouhých řetězců začali vytvářet knihovnu z velmi krátkých. Jako příklad zapsali akronym CNRS, zkratky francouzského Národního centra pro vědecký výzkum, s použitím šesti polymerů, tedy 32bitovou zprávu při kódovaní pomocí standardních ASCII znaků. Jejich přístup byl původní v tom, že ukládali zprávu řazením řetězců různých délek. Zprávu pak četli tak, že nejprve roztřídili řetězce od nejkratšího po nejdelší s pomocí hmotového spektrometru a poté je sekvenovali, tj. zjišťovali pořadí jejich jednotlivých molekul. Více řetězců kratších než jeden nanometr lze totiž snadněji kontrolovat než jeden dlouhý. Informace je pak uchovávána v různém pořadí řetězců různých délek.

Kódování pomocí polymerních řetězců

Srovnání zápisů do jednoho dlouhého řetězce a do sekvencí řetězců různých délek.
Zdroj: CNRS.

Pro ukládání velkých množství informací a rozsáhlých knihoven řetězců bude ale nutné zlepšit současné technologie. Například zápis dat by šel urychlit tak, že by řetězce byly syntetizovány paralelně a ne jeden po druhém. Přestože zapisování a čtení těchto polymerů je v současné době velmi nákladné, máme již dnes pro tyto technologie smysluplné využití. Vložení kódovaných polymerů do drahých elektronických zařízení nebo uměleckých děl může sloužit jako identifikační štítek tvůrce nebo majitele. Přečtení vzorku řetězců molekul pak poslouží vyšetřovatelům k odhalení zdroje výrobku či díla a pomůže jim najít padělky a kradené zboží.

Závěr

Reza Zadegan, který se uchováváním dat do polymerových řetězců zabývá, tvrdí, že oba způsoby – jak pomocí DNA, tak pomocí syntetických molekul umožní v budoucnosti snížit objem datových úložišť. U vznikajících technologií je podstatné to, že není nutné pro syntetizaci polymerů používat pouze řetězce dvou různých délek, tedy chemickou náhradu digitální 0 a 1, ale polymery lze syntetizovat z více druhů molekul, tj. kód by již nemusel být digitální v původním slova smyslu, ale skládat se z více „písmen“. Může se stát, že se plasty stanou základem pro novou plastovou molekulovou abecedu a jednoho dne náš pevný disk bude jen hromádkou plastu a špioni budou informace převážet zapsány přímo v karoserii svých trabantůTrabant – vozidlo vyráběné v komunistické éře v tehdejším východním Německu v automobilce Sachsenring. Dvoutaktní vozidlo s karosérií z duroplastu se stalo symbolem komunistického stylu života ve východní Evropě..

Trabant

Odkazy

Valid HTML 5Valid CSS

Aldebaran Homepage