Carrera de extracción de datos — resultados
Invoice — Blue Harbor Logistics
$0.0076 total
Marcador
#1 Claude Opus 4.7Anthropic★ Ganó esta ronda en este documento
94/100
1940 ms · $0.0051
| Campo | Esperado | Respuesta del modelo | |
|---|---|---|---|
| tax | 256 | 256 | exacto |
| total | 3456 | 3456 | exacto |
| vendor | Blue Harbor Logistics | Blue Harbor Logistics | exacto |
| customer | Greenfield Markets | Greenfield Markets | exacto |
| due_date | 2026-06-11 | 06/11/2026 | cercano |
| subtotal | 3200 | 3200 | exacto |
| invoice_date | 2026-05-12 | 05/12/2026 | cercano |
| account_last4 | 8842 | 8842 | exacto |
| payment_terms | Net 30 | Net 30 | exacto |
| invoice_number | INV-2026-0451 | INV-2026-0451 | exacto |
#2 Claude Sonnet 4.6Anthropic
85/100
2535 ms · $0.0025
| Campo | Esperado | Respuesta del modelo | |
|---|---|---|---|
| tax | 256 | $256.00 | cercano |
| total | 3456 | $3,456.00 | cercano |
| vendor | Blue Harbor Logistics | Blue Harbor Logistics | exacto |
| customer | Greenfield Markets | Greenfield Markets | exacto |
| due_date | 2026-06-11 | 06/11/2026 | cercano |
| subtotal | 3200 | $3,200.00 | cercano |
| invoice_date | 2026-05-12 | 05/12/2026 | cercano |
| account_last4 | 8842 | 8842 | exacto |
| payment_terms | Net 30 | Net 30 | exacto |
| invoice_number | INV-2026-0451 | INV-2026-0451 | exacto |
Documento fuente
INVOICE #INV-2026-0451 from Blue Harbor Logistics to customer Greenfield Markets. Invoice date: 05/12/2026. Payment due: 06/11/2026. Line items: freight handling, customs clearance, and last-mile delivery. Subtotal: $3,200.00. Tax (8%): $256.00. Total due: $3,456.00. Payment terms are Net 30. Please remit to account ending 8842. Extract the following fields as JSON: invoice_number, vendor, customer, invoice_date, due_date, subtotal, tax, total, payment_terms, account_last4.
Cómo funciona la puntuación
Cada modelo recibió exactamente la misma instrucción y lista de campos y respondió una vez a temperatura 0. Comparamos cada campo con el valor real: una coincidencia exacta obtiene crédito completo, el mismo valor en otro formato obtiene crédito parcial, lo demás no obtiene nada. Ningún modelo juzga a otro: la puntuación es pura comparación de campos. Ganar significa que este modelo obtuvo la mayor puntuación en ESTE documento con ESTOS campos, no que sea mejor en general.