Astăzi 22 octombrie 2024
Utilizatorul nu mai este necesar — noul model AI Anthropic gestionează singur PC-ul. Primăvara trecută, Anthropic a anunțat intenția de a crea un algoritm avansat pentru autoînvățarea IA, capabil să îndeplinească autonom majoritatea sarcinilor de birou, facilitând astfel automatizarea unei părți semnificative a economiei. Recent, compania a lansat versiunea 3.5 a modelului său Claude Sonnet, care interacționează prin API Computer Use cu aplicații desktop, imitând apăsările de taste, clicurile și gesturile mouse-ului, replicând acțiunile umane.
„Am învățat Claude să observe ce se întâmplă pe ecran și să utilizeze instrumentele software disponibile pentru a îndeplini sarcini,” raportează Anthropic. „Când un dezvoltator îi cere lui Claude să folosească un software specific pe computer, el analizează capturile de ecran pentru a determina mișcările necesare ale cursorului.”
Conceptul de „agent IA” care automatizează sarcinile pe PC nu este nou. Acesta se referă la IA capabilă să interacționeze cu software-ul de pe computer. Multe companii, inclusiv Microsoft, Salesforce și OpenAI, oferă astfel de soluții, alături de noi jucători ca Relay și Automat. Startupul Rabbit a prezentat un agent care poate achiziționa bilete online autonom. Adept, recent achiziționat de Amazon, învață să navigheze pe site-uri și să utilizeze software-ul, iar Twin Labs folosește modele predefinite pentru automatizarea proceselor de birou.
Unii analiști consideră că agenții de IA vor oferi companiilor o modalitate mai eficientă de a monetiza investițiile semnificative în IA. Potrivit unui sondaj recent, 10% dintre organizații utilizează deja agenți de IA, iar 82% intenționează să-i integreze în următorii trei ani.
Anthropic numește agentul său IA „strat de acțiune-executare”, permițându-i să execute comenzi la nivel de birou. Datorită capacității de a naviga pe paginile web, Claude 3.5 Sonnet poate utiliza orice site și aplicație în activitatea sa. „Oamenii controlează procesul prin sugestii care ghidează acțiunile lui Claude,” explică un reprezentant al Anthropic. „Claude descompune sugestiile utilizatorului în comenzi computerizate pentru a finaliza sarcina.”
Ce diferențiază Claude 3.5 Sonnet de alți agenți AI? Anthropic susține că acesta este un model mai puternic și mai fiabil, capabil să gestioneze sarcinile de codare mai eficient decât flagship-ul OpenAI. Claude își corectează și repetă sarcinile autonom, chiar și în fața obstacolelor, lucrând la obiective complexe.
Cu toate acestea, Anthropic recunoaște că modelul are dificultăți cu acțiuni de bază, cum ar fi derularea și redimensionarea, și poate omite evenimente scurte. În teste, Claude 3.5 Sonnet a finalizat cu succes mai puțin de jumătate din sarcinile de rezervare a biletelor de avion.
Rezultatele testării comparativă a modelelor IA de către compania Anthropic
Referitor la securitate, un studiu recent a arătat că modele fără acces la aplicații desktop pot fi implicate în comportamente dăunătoare, cum ar fi comandarea de documente false pe dark web. Rezultate similare au fost obținute folosind metode de jailbreak, ceea ce sugerează riscuri semnificative.
Un model cu acces la controlul PC-ului ar putea provoca daune mai mari, cum ar fi exploatarea vulnerabilităților aplicațiilor pentru a compromite informațiile personale. Anthropic nu contestă că utilizarea lui Claude 3.5 Sonnet expune utilizatorii la riscuri suplimentare, dar consideră că este esențial să observăm și să învățăm din problemele apărute.
Anthropic a implementat măsuri pentru a preveni utilizarea necorespunzătoare, precum excluderea antrenării modelului pe capturi de ecran și accesul la internet în timpul antrenamentului. Compania a dezvoltat clasificatoare pentru a împiedica acțiuni cu risc ridicat.
Anthropic a anunțat că poate „limita accesul la funcții suplimentare, dacă este necesar.” De asemenea, păstrează toate capturile de ecran realizate de Computer Use timp de cel puțin 30 de zile, ceea ce poate crea riscuri suplimentare pentru securitate. Compania nu a specificat în ce condiții ar putea transmite capturile de ecran unei terțe părți.
„Nu există metode fiabile, iar noi vom evalua constant măsurile de securitate pentru a echilibra capacitățile lui Claude cu utilizarea responsabilă,” afirmă Anthropic. Utilizatorii ar trebui să ia măsuri de precauție pentru a reduce riscurile, inclusiv izolarea lui Claude de datele sensibile.
Sursa imaginii: Pixabay
Simultan cu lansarea modelului Claude 3.5 Sonnet, Anthropic a anunțat că versiunea actualizată Claude 3.5 Haiku va fi disponibilă curând. „Datorită vitezei ridicate și îmbunătățirii în urmarea instrucțiunilor, Claude 3.5 Haiku este bine adaptat pentru sarcini specializate și analize de date,” se menționează în comunicatul companiei. Haiku va fi disponibil inițial ca model text, urmat de un pachet multimodal care analizează atât text, cât și imagini.
Referitor la modelul actualizat Claude 3.5 Opus, un reprezentant Anthropic a declarat că toate modelele din familia Claude au aplicații individuale pentru clienți. Dezvoltatorii pot testa deja Computer Use prin API-ul Anthropic, Amazon Bedrock și Google Cloud.