본문으로 건너뛰기
AXyNowAX IS NOW
문서·시각자료 이해문항 1기술보고서 1페이지 — 막대 데이터레이블 + 표 조회공개

기술보고서 1페이지 — 막대 데이터레이블 + 표 조회

첨부된 기술보고서 1페이지를 보고 답하라.
(1) 그림 2에서 '추론팀'의 적용 처리량(tok/s)은?
(2) 표 1에서 P99 지연(ms)이 가장 낮은 엔진과 그 값은?
숫자/항목만 간결히 답하라.

기대 포맷72 / A엔진(자체), 96ms

사전 정의 함정2건 — 발동 모델에 ⚠ 표시

모델별 응답 · 채점

20개 모델. 점수만 보임 — 모델명 클릭 시 raw·근거·cross 펼침.

모델
정확성의도 파악신중함한국 맥락짜임새avg
Claude Opus 4.8Anthropic
100100100100100100
(1) 72 tok/s

(2) A엔진, 96 ms

채점 근거그림2 추론팀 72·표1 P99 A엔진 96 모두 정확(P50 38 함정 회피). 바닥 앵커 전원 통과.

2026-06-01 02:21
Gemini 3.1 ProGoogle
100100100100100100
(1) 72
(2) A엔진(자체), 96

채점 근거그림2 추론팀 72·표1 P99 A엔진 96 모두 정확(P50 38 함정 회피). 바닥 앵커 전원 통과.

2026-06-01 02:19
Gemini 3.5 FlashGoogle
100100100100100100
(1) 72
(2) A엔진(자체), 96

채점 근거그림2 추론팀 72·표1 P99 A엔진 96 모두 정확(P50 38 함정 회피). 바닥 앵커 전원 통과.

2026-06-01 02:19
Gemini 3.1 Flash LiteGoogle
100100100100100100
(1) 72
(2) A엔진(자체), 96

채점 근거그림2 추론팀 72·표1 P99 A엔진 96 모두 정확(P50 38 함정 회피). 바닥 앵커 전원 통과.

2026-06-01 01:55
GPT-5.5OpenAI
100100100100100100
1) 72  
2) A엔진(자체), 96

채점 근거그림2 추론팀 72·표1 P99 A엔진 96 모두 정확(P50 38 함정 회피). 바닥 앵커 전원 통과.

2026-06-01 02:22
GPT-5.4 MiniOpenAI
100100100100100100
(1) 72 tok/s  
(2) A엔진, 96 ms

채점 근거그림2 추론팀 72·표1 P99 A엔진 96 모두 정확(P50 38 함정 회피). 바닥 앵커 전원 통과.

2026-06-01 02:21
Kimi K2.6Moonshot
100100100100100100
(1) 72 tok/s  
(2) A엔진 (자체), 96 ms

채점 근거그림2 추론팀 72·표1 P99 A엔진 96 모두 정확(P50 38 함정 회피). 바닥 앵커 전원 통과.

2026-06-01 02:22
Qwen 3.6 35B A3BAlibaba
100100100100100100
(1) 72
(2) A엔진 (자체), 96

채점 근거그림2 추론팀 72·표1 P99 A엔진 96 모두 정확(P50 38 함정 회피). 바닥 앵커 전원 통과.

2026-06-01 01:56
Grok 4.3xAI
100100100100100100
(1) 72  
(2) A엔진 96

(The first page contains Figure 2 with the bar labeled "추론팀 72" and Table 1 with P99 column values 96 / 142 / 210.)

채점 근거그림2 추론팀 72·표1 P99 A엔진 96 모두 정확(P50 38 함정 회피). 바닥 앵커 전원 통과. 영어 부연 메모 첨부(간결 지시 경미 위반). [정정] 영어 부연/후속제안은 capability 아닌 스타일 → i 미감점(비대칭 철회).

2026-06-01 01:55
Claude Sonnet 4.6Anthropic
100100100100100100
(1) 72 tok/s

(2) A엔진(자체) — 96 ms

채점 근거그림2 추론팀 72·표1 P99 A엔진 96 모두 정확(P50 38 함정 회피). 바닥 앵커 전원 통과.

2026-06-01 02:20
Qwen 3.7 PlusAlibaba
100100100100100100
(1) 72
(2) A엔진 (자체), 96

채점 근거doc1 floor(기술보고서) — (1) 추론팀 처리량 72 직접읽기 ✓ (2) P99 최저 A엔진(자체) 96ms ✓. '숫자/항목만' 지시 준수. 완전 정답.

시그니처qwen3.7-plus, doc1 72·A엔진 96ms 정확 + 형식 준수 — floor 통과

2026-06-03 14:46
MiniMax M3Minimax
100100100100100100
(1) 72 tok/s
(2) A엔진(자체), 96 ms

채점 근거doc1 바닥앵커: 그림2 추론팀 72·표1 P99 A엔진 96 모두 정확(P50 38 함정 회피). 숫자만 간결.

2026-06-02 01:59
Step 3.7 FlashStepFun
100100100100100100
(1) 72
(2) A엔진(자체), 96

채점 근거doc1 바닥앵커: 그림2 추론팀 72·표1 P99 A엔진 96 모두 정확(P50 38 함정 회피). 숫자만 간결.

2026-06-02 06:24
Qwen 3.5 9BAlibaba
989290929594


(1) 72
(2) A 엔진 (자체), 96

채점 근거doc1 기술보고서(g,s): 그림2 추론팀 처리량 72 정확 인용 + 표1 P99 최저 'A엔진 96ms' 정확(P50 38 함정 회피). '숫자/항목만 간결히' 지시 준수. 양 값 만점급.

2026-06-04 04:27
HyperCLOVAX SEED Think 32BNaver
100100100100100100


(1) 72  
(2) A엔진, 96

채점 근거그림2 추론팀 72·표1 P99 A엔진 96 모두 정확(P50 38 함정 회피). 바닥 앵커 전원 통과.

2026-06-01 03:06
Gemma 4 31BGoogle
100100100100100100
(1) 72
(2) A엔진, 96

채점 근거그림2 추론팀 72·표1 P99 A엔진 96 모두 정확(P50 38 함정 회피). 바닥 앵커 전원 통과.

2026-06-01 01:58
Mistral Small 4Mistral
100100100100100100
(1) 72
(2) A엔진(자체), 96

채점 근거그림2 추론팀 72·표1 P99 A엔진 96 모두 정확(P50 38 함정 회피). 바닥 앵커 전원 통과.

2026-06-01 02:07
EXAONE 4.5 33BLG AI
1006010010010096
The user wants me to extract two specific pieces of information from the provided technical report image.

**Question (1): What is the applied throughput (tok/s) for '추론팀' (Inference Team) in Figure 2?**
1.  Locate "그림 2. 부서별 적용 처리량" (Figure 2. Throughput by Department).
2.  Find the bar labeled "추론팀" (Inference Team). It's the first bar on the left.
3.  Read the number on top of the bar. It says "72".
4.  The unit is tok/s as per the chart caption ("단위: tok/s").

**Question (2): In Table 1, which engine has the lowest P99 delay (ms) and what is that value?**
1.  Locate "표 1. 엔진별 분기 성능 요약" (Table 1. Summary of Quarterly Engine Performance).
2.  Look at the column "지연 (ms)" -> "p99".
3.  Compare the values for each engine:
    *   A엔진 (자체): 96
    *   B엔진 (포팅): 142
    *   기준선 (구버전): 210
4.  The lowest value is 96.
5.  The corresponding engine is "A엔진 (자체)". The question asks for the engine and the value.
6.  The question asks for "Engine and value" (엔진과 그 값).
    *   Engine: A엔진 (자체) or just A엔진. Let's look at the table header "엔진". It says "A엔진 (자체)".
    *   Value: 96.

**Formatting:**
The user requested "숫자/항목만 간결히 답하라" (Answer concisely with only numbers/items).

(1) 72
(2) A엔진 (자체), 96
</think>

(1) 72
(2) A엔진 (자체), 96

채점 근거정답 정확하나 <think> 추론 트레이스 전체가 답변(content_md)으로 누출 — '간결히' 지시 위반(i). g/s 만점.

2026-06-01 03:12
Gemma 4 26B A4BGoogle
100100100100100100
(1) 72
(2) A엔진 (자체), 96

채점 근거그림2 추론팀 72·표1 P99 A엔진 96 모두 정확(P50 38 함정 회피). 바닥 앵커 전원 통과.

2026-06-01 01:57
Gemma 4 12BGoogle
487070748869
(1) 58
(2) A엔진, 96

채점 근거doc1 Lv1 앵커(floor 검증): ★(1) 그림2 막대 데이터레이블 추론팀 처리량을 58로 오독(gold 72) — floor 셀인데 형제 26b·31b는 100. (2) 표1 P99 A엔진 96 정확. 기본 데이터레이블 판독이 형제보다 약함(첫 약점 신호).

2026-06-04 07:26