Un documento di ricerca di Apple descrive Ferret-UI, un sistema di intelligenza artificiale generativa appositamente progettato per essere in grado comprendere come funzionano le app. Il modello potrebbe avere degli impieghi rivoluzionari, come utilizzare autonomamente le applicazioni.

Attualmente gli MLLM (Multimodal Large Language Models) non sono molto bravi a comprendere le app mobili poiché dovrebbero essere in grado di interagire con loro per fare l’addestramento, tuttavia i ricercatori di Apple credono Ferret-UI possa farlo attraverso esempi di formazione da una vasta gamma di attività elementari dell’interfaccia utente, come il riconoscimento delle icone, la ricerca di testo e l’elenco dei widget.

Questi campioni sono strutturati in modo tale da aumentare la capacità di ragionamento del modello e i ricercatori Apple sostengono che il risultato è migliore sia rispetto a GPT-4V che ad altri MLLM focalizzati sull’interfaccia utente esistenti.

Segui TuttoTech.net su Google Discover

Offerta
-18%

ASUS Vivobook S16, OLED, 16GB/1TB

599€ invece di 730.47€
Offerta
-19%

Tineco Floor ONE S7 Stretch Ultra

299€ invece di 369.99€
Offerta
-20%

msi Modern 14, 16/512 GB

599€ invece di 749€
Offerta
-48%

roborock Qrevo Curv 2 Flow

Offerta + clicca su applica coupon di 50 euro + coupon: TTANDROID5

469€ invece di 899€
Offerta
-11%

Apple iPhone 17, 256 GB

869€ invece di 979€
Offerta
-21%

msi Modern 15, Ryzen 7 7730U

549€ invece di 699€
Offerta
-7%

PS5 Slim + NBA 2K26 Game

539€ invece di 579€
Offerta
-6%

Acer Aspire 14 AI OLED

659€ invece di 699€
Offerta
-40%

Samsung Galaxy Buds4 Pro

Offerta + Coupon: BUDSLIVE

149€ invece di 249€
Offerta
-35%

HUAWEI WATCH FIT 5, NFC

Offerta + coupon: HUAWEIIT30

129€ invece di 199€
Offerta
-28%

DREAME H15 Pro Heat

429€ invece di 599€
Offerta
-40%

roborock Qrevo S Pro Set

Offerta + coupon: TTANDROID5

360.99€ invece di 599.99€
Offerta
-42%

ECOVACS DEEBOT T50 PRO OMNI Gen3

349€ invece di 599€
Offerta
-33%

ECOVACS DEEBOT T90 PRO OMNI

539€ invece di 799€

Ferret-UI di Apple potrebbe imparare a utilizzare le app

Il documento descrive ciò che gli studiosi hanno ottenuto, piuttosto che come potrebbe essere utilizzato il modello, probabilmente anche per questioni di riservatezza, ma potrebbe diventare uno strumento utile per valutare l’efficacia di un’interfaccia utente, migliorare l’accessibilità per le persone con disabilità, ma soprattutto potrebbe potenziare Siri.

L’utente potrebbe chiedere a Siri di prenotare un volo per arrivare in una determinata località entro le ore 10 spendendo meno di una certa cifra. Siri potrebbe quindi interagire con l’app della compagnia aerea per svolgere l’attività al posto dell’utente.

I nostri contenuti da non perdere: