Computer Use di Anthropic: cosa fa davvero nel 2026 | StartApp

Lunedì scorso ho dato a Claude un task semplice: prendere 40 PDF di ordini ricevuti su email, aprire Fatture in Cloud, e creare la fattura corrispondente per ciascuno. Niente API. Niente integrazione. Solo il browser aperto, e lui che muove il mouse al posto mio.

Ha funzionato. Ha fatto 38 fatture su 40 corrette al primo tentativo. Ha fallito su due (in uno ha sbagliato la P.IVA del cliente perché il PDF era scansionato male, nell'altro ha cliccato il pulsante sbagliato dopo un popup di sessione scaduta). Tempo totale: 47 minuti. Costo in API Anthropic: €1,12.

Questa cosa, nel 2022, era fantascienza. Nel 2026 si chiama Computer Use, ed è la categoria di prodotto più sottovalutata dell'anno.

Cos'è successo davvero

Anthropic ha rilasciato Computer Use a ottobre 2024 in beta. L'idea era semplice e radicale: invece di costruire un'integrazione per ogni applicazione (Slack, Notion, Excel, Salesforce…), dare al modello la capacità di vedere uno screenshot, decidere dove cliccare, e muovere mouse e tastiera come farebbe un essere umano.

A novembre 2024 era un giocattolo. A giugno 2026 è infrastruttura.

78%

tasso di successo di Claude Sonnet 4.5 su OSWorld, il benchmark standard per task desktop reali. Era 14% un anno fa.

Come funziona, in tre passaggi

Il loop è semplicissimo (ed è esattamente quello che ha reso difficile crederci, all'inizio):

Il tuo codice fa uno screenshot dello schermo e lo manda a Claude insieme al goal.
Claude restituisce una tool call: left_click(x: 487, y: 312), oppure type("Mario Rossi"), oppure screenshot() per rivedere lo stato.
Il tuo codice esegue l'azione, fa un nuovo screenshot, e ricomincia.

Loop, finché il task non è completo. Nessun DOM scraping. Nessun selettore CSS che si rompe. Solo pixel.

Cosa fa già bene (oggi, non in roadmap)

Ho fatto girare Computer Use su una decina di casi reali nelle ultime 8 settimane. I quattro che funzionano in modo affidabile:

Compilazione di form complessi estratti da fonti destrutturate. Un PDF cliente → un ERP italiano. Il caso fatture in apertura.
Estrazione dati da dashboard senza API. Portale fornitori, gestionali legacy, vecchi sistemi RAI/AGENAS — quel mondo di "non c'è l'API" ora ha una scorciatoia.
Test E2E auto-riparanti. I tuoi Playwright si rompono ogni volta che il designer cambia un margin? Con Computer Use il test cerca "il bottone Salva", non il selettore CSS. Non si rompe più.
Onboarding di SaaS terzi — quei 14 click in sequenza che fai ogni volta che configuri un nuovo cliente su Vercel + Supabase + Stripe + Slack.

Cosa ancora non funziona (la parte che nessuno racconta)

Sarebbe disonesto fermarsi qui. Computer Use ha quattro problemi seri, e ti li racconto perché se li scopri in produzione sono costosi.

I 4 limiti da sapere prima di partire

CAPTCHA: bloccati per design da Anthropic in pre-prompt. Se il tuo workflow ne tocca uno, il task si ferma.
Drag-and-drop su canvas (Figma, Photoshop, Miro): ancora imperfetto. Si rompe a metà.
Velocità: 3-8 secondi per azione. Un task da 50 step richiede 4-7 minuti. Inadatto al real-time.
Costo non lineare: ogni screenshot consuma token visione. Un task complesso con auto-correzione costa €0,30-1,50. Verifica l'unit economics prima di scalare.

Cosa significa, oggi, per una startup italiana

Quando faccio questa domanda ai founder italiani durante le call di consulenza, vedo sempre lo stesso movimento: pensano a "noi tech che facciamo Computer Use per altre tech". Sbagliato. Il vero unlock è altrove.

Il vero unlock è che in Italia abbiamo un'intera economia che gira su portali che non hanno l'API:

I bandi PNRR, Horizon Europe, Smart&Start si caricano su portali manuali.
I gestionali italiani (Fatture in Cloud, TeamSystem, Zucchetti) hanno API parziali e documentazione caotica.
Le AUSL, le Camere di Commercio, l'Agenzia delle Entrate — montagne di workflow click-and-type.

Una startup che oggi vende "compilazione automatica bandi" via Computer Use può chiedere €2.000-5.000 per ogni dossier completato in 48 ore, vs studi di consulenza che chiedono €8.000-15.000 in 3 settimane. È un mercato che nessun player USA toccherà mai — è troppo locale.

Caso reale (un nostro cliente)

Studio commercialista a Bologna. Aveva 1 persona full-time che caricava 80-120 dichiarazioni IVA al mese sul portale Agenzia delle Entrate. Tempo medio per pratica: 22 minuti. Costo annuo: ~€38.000.

Con Computer Use in pilot da 6 settimane: 95% delle pratiche completate in autonomia in 4-7 minuti, supervisione umana solo sull'ultima conferma. Costo API mensile: €380. Headcount risparmiato: 1 FTE da reassegnare.

ROI mese 1: 8x. Mese 6: stimato 12x.

L'errore più frequente che vediamo

Uso Computer Use anche dove l'API esiste già. Sembra ovvio dirlo, ma le startup che ho visto sbagliare di più sono proprio quelle tecniche, che si innamorano del paradigma e lo applicano a tutto.

Su quel terreno — la persona che clicca — è la rivoluzione silenziosa del 2026.

Cosa stiamo costruendo noi

Stiamo integrando Computer Use in StartApp Toolbox per due workflow specifici:

Caricamento automatico del Business Plan generato sui portali bandi italiani (Smart&Start in primis).
Compilazione del dossier investitori sui portali VC italiani che ricevono tramite form (Indaco, P101, Eureka!).

Quando sarà pronto — ETA settembre 2026 — lo annunceremo qui sul blog. Se vuoi essere il primo a saperlo, iscriviti alla newsletter in fondo.

E se hai un caso d'uso Computer Use in cui non sei sicuro se valga la pena, scrivici: una valutazione veloce te la facciamo gratis.

Argomenti#ai#anthropic#claude#computer-use#automation#agentic-ai

Trovato utile? Condividi con un founder che ne ha bisogno.

LinkedIn X / Twitter WhatsApp Email

L'autore

Team StartApp

Siamo il team di Arcano Zero — AI Lab, basati a Roma. Costruiamo StartApp Toolbox, la piattaforma AI che aiuta i founder italiani a generare Business Plan, Pitch Deck e Financial Model investment-ready. Scriviamo qui di AI, fundraising e ecosistema startup italiano — senza hype.

Prova StartApp →·Scrivici

Ho fatto compilare 40 fatture a Claude. Senza API. Solo guardando lo schermo.

Cos'è successo davvero

Come funziona, in tre passaggi

Cosa fa già bene (oggi, non in roadmap)

Cosa ancora non funziona (la parte che nessuno racconta)

Cosa significa, oggi, per una startup italiana

L'errore più frequente che vediamo

Cosa stiamo costruendo noi

Altri articoli per te

Il governo USA ha spento Fable 5 e Mythos 5. Tre giorni dopo il lancio.

Model Context Protocol (MCP): il protocollo open che cambierà come usi l'AI nel 2026

Claude Code ha sorpassato Cursor in 8 mesi. Ho usato tutti e tre per un mese, dico cosa succede.

Vuoi rendere la tua startup
investment-ready davvero?

Cos'è successo davvero

Come funziona, in tre passaggi

Cosa fa già bene (oggi, non in roadmap)

Cosa ancora non funziona (la parte che nessuno racconta)

Cosa significa, oggi, per una startup italiana

L'errore più frequente che vediamo

Cosa stiamo costruendo noi

Altri articoli per te

Il governo USA ha spento Fable 5 e Mythos 5. Tre giorni dopo il lancio.

Model Context Protocol (MCP): il protocollo open che cambierà come usi l'AI nel 2026

Claude Code ha sorpassato Cursor in 8 mesi. Ho usato tutti e tre per un mese, dico cosa succede.

Vuoi rendere la tua startupinvestment-ready davvero?

Vuoi rendere la tua startup
investment-ready davvero?