Category: Materiale

Învăţarea automatizată accelerează descoperirea de noi materiale

im1

Imagine luată din [1].

Recent, s-a demonstrat că o strategie de cercetare adaptativă bazată pe informatică şi strâns cuplată cu partea experimentală, poate accelera descoperirea de noi materiale cu proprietăți specifice, potrivit unui articol publicat în revista științifică Nature Communications [1].

“Ceea ce am făcut arată că, începând cu un set de date relativ mic de la experimente bine controlate, este posibil să ghidăm iterativ experimentele ulterioare spre găsirea materialului țintă”, a declarat Turab Lookman, fizician și cercetător în știința materialelor în grupul de Fizica Materiei Condensate și Sisteme Complexe de la Los Alamos National Laboratory. Lookman este cercetătorul principal al proiectului de cercetare.

“Găsirea de noi materiale a fost, în mod tradițional, ghidată de intuiție și de încercare-și-eroare (trial-and-error)”, a spus Lookman, conducătorul acestui proiect de cercetare. “Dar odată cu creșterea complexității chimice, posibilitățile de combinare devin prea multe pentru ca abordările de tip încercare-și-eroare să fie practice”.

Pentru a rezolva acestă problemă, Lookman împreună cu colegii săi de la Los Alamos și State Key Laboratory for Mechanical Behavior of Materials din China, au folosit machine learning pentru a accelera procesul. Ei au dezvoltat un model care utilizează inferenţa statistică pentru a ghida iterativ următoarele experimente care urmează să fie efectuate în căutarea unui aliaj cu memoria formei și cu disipare termică foarte mică. Astfel de aliaje sunt critice pentru îmbunătățirea rezistenței materialelor în aplicații de inginerie.

im2

Imagine luată din [1].

“Scopul este de a reduce la jumătate timpul și costul introducerii de noi materiale pe piață”, a spus Lookman. “Ceea ce am demonstrat este un model de învăţare automatizată (machine learning) bazat pe date, care poate duce la descoperirea de noi materiale cu proprietăți direcționate, mult mai rapid decât înainte”. Lucrarea a folosit resursele de supercomputing din cadrul Los Alamos.

Deși inițiativa Materials Genome, care a fost emisă de Oficiul pentru Știință și Tehnologie al Casei Albe în 2011, a catalizat interesul pentru descoperirea accelerată de materiale, acest studiu este unul dintre primele care demonstrează modul în care într-un cadru informatic se poate ajunge la descoperirea de noi materiale.

O mare parte din efortul depus în acest proiect s-a concentrat pe generarea și filtrarea bazelor de date formate prin rularea a mii de calcule de mecanică cuantică. Cu toate acestea, multitudinea de parametri cum ar fi cei chimici, structurali, defectele, soluțiile solide, non-stoechiometria și formarea de compuși cu mai multe componente, introduc o complexitate enormă la care instrumentele actuale nu au fost proiectate să facă față. Mai mult decât atât, puține studii computaționale includ feedback din experimente sau încorporează incertitudini.

Lookman și colegii săi s-au concentrat pe aliaje cu memoria formei pe bază de nichel și titan, dar strategia poate fi folosită pentru orice altă clasă de materiale (polimeri, materiale ceramice sau nanomateriale) sau proprietăți țintă (de exemplu, de răspuns dielectric, coeficienții piezoelectrici sau benzi interzise). Acest lucru devine important atunci când experimentele sau calculele sunt costisitoare și consumatoare de timp. Cu toate că activitatea s-a axat pe explorarea spațiului chimic, aceasta poate fi adaptată cu ușurință pentru a optimiza condițiile de procesare atunci când există mai multe “butoane de ajustare”, care controlează un sistem, în aplicații de fabricație avansate. În mod similar, aceasta poate fi generalizată pentru a optimiza proprietăți multiple, cum ar fi, în cazul aliajului pe bază de nichel-titan, disiparea termică scăzută și o temperatură de tranziție mult mai mare decât temperatura camerei.

Material adaptat după [2].

Referințe:

[1] Dezhen Xue et al, Accelerated search for materials with targeted properties by adaptive design, Nature Communications (2016). DOI: 10.1038/ncomms11241

[2] Los Alamos National Laboratory 

Informatica Materialelor

materials_informatics

Imagine luată din [1].

În 2005 a fost scris un articol în revista Materials Today [2] care introducea ideea că Informatica Materialelor ar trebui să fie considerată o sub-disciplină a științei și ingineriei materialelor, la fel cum Bioinformatica este în domeniul științelor vieții. Unul dintre punctele principale din acel articol este necesitatea de a evalua dacă avem un “ospăţ sau foamete de date”, în orice problemă de știința materialelor. Ideea că am putea avea un “ospăţ” sau o supra-abundență a datelor poate părea la început să fie un concept încurcat, dar se argumentează că  definirea cantitativă a ceea ce constituie date “suficiente” sau “corecte”, în orice problemă de știința materialelor este un  aspect critic al Informaticii Materialelor. Odată cu creșterea în popularitate a expresiilor cum ar fi “designul materialelor”, “ingineria materialelor integral computaţională” sau “genomul materialelor”, există sentimentul că informatica echivalează pur și simplu cu nevoia de mai multe date. Din această perspectivă, accentul activităților “informaticii”  înclină în mod invariabil către necesitatea de a colecta și de a genera mai multe date, abordarea problemelor legate de software și de gestionare a informațiilor pentru a organiza și interoga datele într-o formă digitală și distribuirea acestor date prin tehnologii informatice avansate. De aici, teme precum știința combinatorială a materialelor și screening-ul de cantități mari de date cuplate cu biblioteci digitale au înflorit într-o gamă largă de discipline orientate spre știința materialelor. În mod similar, a existat o creștere a eforturilor comunităţii științifice pentru materiale computaţionale, determinată în mare măsură de domeniul fizicii materiei condensate, profitând de instrumente și algoritmi de calcul pentru a genera matrici masive de rezultate care propun noi proprietăți ale materialelor.

Recunoscând în același timp că aceste eforturi sunt importante și necesare, trebuie subliniat faptul că acestea explorează doar un aspect al domeniului Informaticii Materialelor. Paradigma descoperirii de noi materiale bazată pe date trebuie să exploreze un spațiu al proprietăților cu mult mai multe dimensiuni care să include aspecte cum ar fi incertitudinea, asimetria, densitatea redusă de date, precum și diverse și numeroase forme de date, inclusiv numerice, textuale, conceptuale și imagistice. Integrarea tuturor acestor tipuri diferite și atribute ale datelor, împreună cu cantitatea lor, reprezinta Informatica Materialelor.

Dacă creșterea volumului de date este un criteriu important dar nu suficient pentru informatică, atunci spre ce direcție ar trebui să se îndrepte domeniul Informaticii Materialelor? Răspunsul la aceasta întrebare constă în valorificarea paradigmei “cantității mari de date” sau “Big Data”, unde cuvântul “mare” se referă la mărimea dimensionalității corelațiilor care trebuie explorate în analiza problemelor bazate pe date, din care volumul de date este doar un aspect. Comunitatea mai largă din știința informației a definit “Big Data“ ca fiind guvernată de patru metrici: volum, viteză, varietate și veridicitate. Cele “4V-uri” sunt nucleul informaticii și în prezent, eforturile cele mai mari din Informatica Materialelor sunt concentrate doar pe extinderea volumului de date în detrimentul celorlalte metrici.

Volumul de date este ușor de înțeles. Viteza de date se referă la exploatarea datelor achiziționate în timp real (de exemplu, datele din experimentele de dinamică). Varietatea datelor reprezintă faptul că datele iau multe forme în domeniul științei materialelor, care variază de la valori numerice discrete, descrieri calitative ale comportamentului materialelor și datele imagistice. Veridicitate recunoaște realitatea practică din domeniul științei materialelor și anume că avem o mulțime de date “lipsă” și datele pe care avem au incertitudine asociată cu ele. Cuantificarea aceastei incertitudini, știinţa completării datelor lipsă având la dispoziţie doar cunoștințe limitate, sunt obiective provocatoare dar  posibil de realizat atunci când sunt folosite judicios instrumentele de învățare statistică, căutare de tipare în date și analiză statistica a datelor cu principiile fizicii materialelor, chimiei și ingineriei. Chiar și cu date limitate, această abordare a fost folosită cu succes în descoperirea de noi materiale, identificarea unor noi parametri fizici care controlează relațiile structură-proprietate și dezvoltarea de mijloace rapide pentru generarea de date de referință. Aceasta este puterea Informaticii Materialelor.

În cele din urmă, trebuie reiterat faptul că scopul final pentru Informatica Materialelor  este de a descoperi noi cunoștințe. Creșterea volumului de date nu crește în mod necesar cunoașterea, un fapt bine cunoscut în știința informației dar și în alte domenii precum genomica și biotehnologia. De multe ori cunoșterea este ascunsă în date dar creșterea volumului de date fără a aborda celelalte V-uri agravează problema prin creșterea decalajului dintre cunoaștere și date. Poate exista un sentiment fals de securitate intelectuală fiind înconjurat de o mulțime de date. Informatica este știința modului de abordare a celor 4 V-uri ale “Big Data” simultan și integrarea constatărilor din aceste eforturi. Aici este locul unde instrumente cum ar fi machine learning cuplat cu statistica trebuie conectate în mod judicios la fundamentele științei materialelor, și anume teorie, modelare și experimente pentru a face din bazele de date un laborator pentru generarea de cunoştinţe noi și nu doar un depozit pentru găsirea unor informații cunoscute sau de așteptat. Informatica Materialelor este știința care formalizează utilizarea acestor instrumente și deține cheia pentru un viitor promițător și bogat pentru știința materialelor.

Material adaptat după [3].

Referințe:

[1] NSF 

[2] K. Rajan, Materials informatics. Mater. Today 8(10), 38-45 (2005); DOI: 10.1016/S1369-7021(05)71123-8

[3] K. Rajan, How do we go about harnessing the “Big Data” paradigm? Mater. Today 15(11), 470 (2012); DOI: 10.1016/S1369-7021(12)70204-3