Naar inhoud

Data-extractie race — resultaten

Invoice — Blue Harbor Logistics

$0.0076 total

Scorebord

#1 Claude Opus 4.7AnthropicWon deze ronde op dit document
94/100
1940 ms · $0.0051
VeldVerwachtAntwoord model
tax256256exact
total34563456exact
vendorBlue Harbor LogisticsBlue Harbor Logisticsexact
customerGreenfield MarketsGreenfield Marketsexact
due_date2026-06-1106/11/2026bijna
subtotal32003200exact
invoice_date2026-05-1205/12/2026bijna
account_last488428842exact
payment_termsNet 30Net 30exact
invoice_numberINV-2026-0451INV-2026-0451exact
#2 Claude Sonnet 4.6Anthropic
85/100
2535 ms · $0.0025
VeldVerwachtAntwoord model
tax256$256.00bijna
total3456$3,456.00bijna
vendorBlue Harbor LogisticsBlue Harbor Logisticsexact
customerGreenfield MarketsGreenfield Marketsexact
due_date2026-06-1106/11/2026bijna
subtotal3200$3,200.00bijna
invoice_date2026-05-1205/12/2026bijna
account_last488428842exact
payment_termsNet 30Net 30exact
invoice_numberINV-2026-0451INV-2026-0451exact

Brondocument

INVOICE #INV-2026-0451 from Blue Harbor Logistics to customer Greenfield Markets. Invoice date: 05/12/2026. Payment due: 06/11/2026. Line items: freight handling, customs clearance, and last-mile delivery. Subtotal: $3,200.00. Tax (8%): $256.00. Total due: $3,456.00. Payment terms are Net 30. Please remit to account ending 8842. Extract the following fields as JSON: invoice_number, vendor, customer, invoice_date, due_date, subtotal, tax, total, payment_terms, account_last4.

Hoe de score werkt

Elk model kreeg exact dezelfde prompt en veldenlijst en antwoordde één keer op temperatuur 0. We vergelijken elk veld met de juiste waarde: een exacte match geeft volledige punten, dezelfde waarde in een ander formaat geeft gedeeltelijke punten, al het andere geeft niets. Geen enkel model beoordeelt een ander — de score is pure veldvergelijking. Winnen betekent dat dit model het hoogst scoorde op DIT document met DEZE velden, niet dat het in het algemeen beter is.