11.7 C
Campulung Muscel
sâmbătă, 25 mai, 2024

A apărut primul model în limba română pentru A.I (inteligența artificială) de tip ChatGPT

Alte Știri

A apărut primul model în limba română pentru A.I (inteligența artificială) de tip ChatGPT. O echipă de cercetători români a creat un model de limbaj (LLM – „large language model”) dedicat limbii române. Acesta poate fi folosit pentru dezvoltarea unor unelte și platforme A.I.

Modelul este „open source”, deci va putea fi accesat și folosit de oricine dorește să construiască instrumente bazate pe inteligența artificială. Odată cu publicarea acestui LLM, inițiatorii proiectului lansează și comunitatea OpenLLM-Ro. Cea care dorește să-i aducă împreună pe toți cei care vor să contribuie în diverse forme la dezvoltarea tehnologiilor A.I. pentru limba română.

CITEȘTE ȘI. Se anunță cel mai mare eveniment al anului la Câmpulung. Bulevardul Pardon va fi călcat în picioare de mii de oameni!

Ambele proiecte sunt inițiate și derulate de către POLITEHNICA București, Universitatea din București și Institutul de Logica și Știința Datelor, cu sprijinul BRD Groupe Société Générale.

CITEȘTE ȘI. Ajung noile taloane la pensionari. Ce trebuie să verifice aceștia URGENT!

Deși este o tehnologie la care avem acces la scară largă de doar câțiva ani, mulți dintre noi am interacționat deja de foarte multe ori cu roboți conversaționali. Cei precum ChatGPT (produs de OpenAI), Copilot (dezvoltat de Microsoft), Gemini (dezvoltat de Google) etc.

CU CINE VOTAȚI LA PRIMĂRIA CÂMPULUNG, LA ALEGERILE DIN DATA DE 9 IUNIE?

View Results

Loading ... Loading ...

Însă, pentru limba română rezultatele sunt uneori imprecise, pentru că modelele pe care sunt instruite nu au fost expuse multor surse românești de date. Totodată, aceste genuri de unelte nu pot fi folosite în companii.

CITEȘTE ȘI. Prețul colosal cu care se vinde o bancnotă de 100 de lei cu chipul lui Bălcescu. O adevărată avere

Deoarece accesul direct poate fi restricționat din rațiuni de securitate și confidențialitate. O soluție în aceste situații este implementarea unui model local aflat în infrastructura companiei. Aceste modele publice care pot fi folosite local sunt în general, însă, antrenate pe limba engleză sau folosind un număr redus de documente în limbile cu circulație mai scăzută.

CITEȘTE ȘI. Famiile sărace din România primesc câte 500 de lei de la Stat

A apărut primul model în limba română pentru A.I (inteligența artificială) de tip ChatGPT

Modelul românesc lansat astăzi este adaptarea unui LLM public dezvoltat în principal pentru limba engleză. Însă acesta a fost expus la câteva milioane de documente în limba română, pentru a înțelege mai bine semnificația cuvintelor. Acest lucru e esențial pentru perfomanța unor astfel de modele în situații unde exprimarea cerinței sau a întrebării introduse de utilizator, cât și a răspunsului trebuie să fie în limba română.

CITEȘTE ȘI. Dispare încă un card în România. Ce trebuie să știi URGENT dacă îl folosești!

Începând din a doua parte a anului 2023, la dezvoltarea și instruirea acestui LLM a lucrat o echipă de cercetători de la POLITEHNICA București, Universitatea din București și Institutul de Logica și Știința Datelor.

CITEȘTE ȘI: Ion Mînzînă: Din această lună, argeșenii și nu numai, se vor bucura de modernizarea unui drum foarte tranzitat din Argeș

Partenerii academici au contribuit cu cercetători care au lucrat pro-bono și, în plus, POLITEHNICA București a pus la dispoziție și puterea de calcul necesară antrenării modelului. Partenerul principal al proiectului este BRD Groupe Société Générale, care susține inovația și tehnologiile viitorului în România în toate formele lor.

CU CINE VOTAȚI LA PRIMĂRIA CÂMPULUNG, LA ALEGERILE DIN DATA DE 9 IUNIE?

View Results

Loading ... Loading ...

„Pentru ca mediul economic și/sau instituțional din România să poată folosi această nouă tehnologie atât de promițătoare, este nevoie de modele specializate care să fi întâlnit o mulțime de conversații și documente în limba română. Motivul este simplu: pentru a ne putea oferi informațiile de care avem nevoie.

CITEȘTE ȘI. Codul Rutier. Când are voie un copil să stea pe locul din față al mașinii

În BRD lucrăm în mod constant la soluții care să ne îmbunătățească procesele de lucru. Folosind cele mai noi tehnologii care pot aduce valoare adăugată în primul rând clienților noștri. Însă înțelegem totodată că nevoile noastre sunt comune cu ale multor altor actori instituționali. Și ne-am asumat misiunea de a sprijini timpuriu inovația în domeniul inteligenței artificiale.

CITEȘTE ȘI. Bijuteria Argeșului care se învârte după soare. Încep lucrările la o investiție de 100 de milioane de EURO

Implicându-ne în peisajul extrem de animat al acesteia, putem ajuta ca cele mai noi tehnologii să aibă un impact pozitiv în societatea românească. Aproape în același ritm cu evoluțiile din domeniu la nivel internațional”, a declarat Horia Velicu, Head of Innovation Lab în cadrul BRD Groupe Société Générale.

CITEȘTE ȘI. Când pică Paștele în 2025? Se întâmplă acest lucru, numai o dată la 10 ani!

„Câteva dintre exemplele de utilizare ale modelului românesc sunt: căutarea de informații în baza de cunoștințe a unei organizații, cu ghiduri și proceduri de lucru. Sau roboți conversaționali pentru clienții companiilor sau ai instituțiilor care să îi ghideze în parcurgerea pașilor necesari pentru utilizarea unui produs sau serviciu.

CU CINE VOTAȚI LA PRIMĂRIA CÂMPULUNG, LA ALEGERILE DIN DATA DE 9 IUNIE?

View Results

Loading ... Loading ...

În ambele cazuri, angajații și/sau clienții economisesc timp în accesarea informației, beneficiind în multe situații și de îmbunătățirea calității acesteia”, a spus Alin Ștefănescu, directorul Departamentului de Informatică din cadrul Universității din București și vicepreședintele Institutului de Logică și Știința Datelor.

CITEȘTE ȘI. Cât e rata lunar pentru o Dacia Jogger hybrid în 2024, dacă o cumperi în leasing pe 5 ani

Efortul de specializare a unui model dedicat unei limbi este frecvent coordonat de către comunitatea academică asociată limbii respective. Exemple recente fiind din țări precum Franța, Germania, Spania, Finlanda, Bulgaria. Resursele necesare sunt însă considerabile atât din punct de vedere al infrastructurii tehnice necesare (de exemplu, hardware dedicat, precum plăci grafice de mare putere). Cât și în ce privește cercetătorii și programatorii experimentați.

Este deci nevoie de o susținere pe scară largă și pe termen mediu și lung din partea multor actori-cheie ai societății. Cum ar fi mediul economic, cel academic și nu în ultimul rând mediul guvernamental, prin programele dedicate dezvoltării tehnologiilor de Inteligență Artificială.

CITEȘTE ȘI. Ministrul Muncii, Simona Bucura Oprescu s-a întâlnit cu antreprenorii români care au dezvoltat afaceri importante în Spania

De aceea, dezvoltatorii acestui model lansează în același timp și comunitatea OpenLLM.ro. Aceasta își propune să încurajeze interacțiunea între diverși actori sau facilitatori ce doresc să contribuie la dezvoltarea acestei tehnologii pentru limba română și lansarea unor modele specializate pentru anumite domenii.

Inițierea acestui dialog într-un mediu „open source” va accelera crearea unor modele mai performante, implementate în companiile sau instituțiile românești, ceea ce va rezulta într-un plus de productivitate per ansamblu a întregii societăți.

CITEȘTE ȘI. Se dau 3.500 de lei în fiecare lună pentru aceste persoane!

„Sperăm ca lansarea acestui model să fie doar începutul unui efort de lungă durată din care să rezulte LLM-uri mai bune pentru limba română. Deja am descoperit o metodă pe care vrem să o aplicăm altor modele lansate recent (Llama-3 și Mistral). Și care au performanțe în general mai bune ca cel de la care am pornit (Llama-2).

CITEȘTE ȘI. ȘTIAȚI CĂ: Mânăstirea Cetățuia Negru Vodă este „Meteora României“?

Totuși, pentru a avea modele performante pentru limba română avem nevoie de 2 tipuri de resurse: colecții de date mari și curatoriate, de calitate bună. Precum și resurse hardware (în special, GPU-uri pentru antrenarea modelelor). Sperăm ca atât entitățile private, cât și cele publice să înțeleagă importanța dezvoltării modelelor mari de limbaj și multimodale (text-imagini) pentru limba română. Pe toți îi așteptăm să ni se alăture în cadrul inițiativei OpenLLM-Ro și a proiectelor de cercetare care o vor sprijini”, a declarat Traian Rebedea, conferențiar la POLITEHNICA București și cercetător principal la NVIDIA, unul dintre coordonatorii tehnici ai inițiativei OpenLLM-Ro.

CITEȘTE ȘI. Lumeee, lumeee are loc vestita serbare câmpenească – Urcă oile la munte

Raportul tehnic poate fi găsit aici: https://arxiv.org/abs/2405.07703.

Modelul LLM poate fi descărcat de pe platforma Hugging Face: https://huggingface.co/OpenLLM-Ro.

CITEȘTE ȘI. Ce veste grozavă! Pensionarii care vor încasa a 13-a pensie de la 1 septembrie!

Urmărește știrile Ziarului din Muscel și pe pagina de Facebook, pe grupul Cititorii Ziarului din Muscel, pe Tik Tok sau direct pe canalul de WhatsApp.

Ultimele Știri

Cei mai îndrăgiți într-un mega concert Delafun la restaurantul Curtea Veche din Câmpulung Muscel

Cei mai îndrăgiți într-un mega concert Delafun la restaurantul Curtea Veche din Câmpulung Muscel. Deschis recent în orașul de...

Alte știri din aceeași categorie