본문으로 건너뛰기
AXyNowAX IS NOW
분석·2026-06-04·15

코딩에 올인한 모델, MiniMax M3

글로벌 리더보드에서 난리 난 MiniMax M3를 한국 세무, 노무, 개발, 마케팅 5개 분야 테스트를 진행했습니다. 결론은 극단적입니다. 코딩은 훌륭한데, 한국 관련 지식만 나오면 아무것도 모릅니다.

코딩에 올인한 모델, MiniMax M3
  • AXyBench
  • MiniMax M3
  • 모델조명
  • 장단점분석
  • 개발
  • 노무
  • 세무

프리미엄 AI 매거진 AXyNow, 손상윤입니다.

실어나르지 않고 직접 추론해서 굴려보는 제 스타일, 다들 잘 아실 겁니다.

요즘 해외에서 핫하다는 중국계 스타트업의 MiniMax M3를 AXyBench에 넣고 한국 실무 5대 영역으로 테스트 해봤네요. 종합 등급은 B+. 하지만 이 등급은 착시입니다. 코딩과 마케팅 분석에선 S+급 지능을 보여주지만, 한국 세무와 노무에선 F급을 보여줍니다.

이 녀석, 우리 회사에 고용할 수 있을지 이력서를 탈탈 털어보죠.


1. 0과 100을 오가는 극단적인 성적표

이 모델의 결과지를 받아 들고 저는 실소를 금치 못했습니다. 이렇게 지능의 편차가 널뛰기를 하는 모델은 최근 들어 처음 봅니다. 아래는 AXyBench 실측 데이터를 기반으로 도출한 MiniMax M3의 카테고리별 성적표입니다.

MiniMax M3 Performance Hero 이미지 1: 복잡한 지표 앞에 머리를 감싸 쥔 1인 사장의 모습. M3의 성적표를 보면 딱 이런 표정이 나옵니다. (출처: Pexels)

AXyBench 실측 채점 매트릭스

분류직무 카테고리획득 등급핵심 실측 요약
Cluster T (기술)T1. 코드 및 시스템 개발S+asyncio 조용한 실패 원인 규명, React 19 sticky z-index 완벽 해결
T2. 데이터 및 문서 출력S이중축 0선 대칭 픽셀 정렬, 껍데기 지표(Vanity) 감별 능력 탑티어
Cluster B (사업)B4. 마케팅 및 콘텐츠S한국 특유의 체면 문화(Hofstede)를 반영한 겸손한 후크 카피 설계
B2. 계약 및 법무B산재보험 전원 가입은 맞췄으나, 저작재산권 양도 특약 한계 노출
B3. 인사 및 노무F존재하지 않는 가짜 근로기준법 개정안을 날조하고 형량 소설 집필
Cluster P (개인)P1. 사적 주식 투자C의사결정 트리는 훌륭하나, '일반 개미에게 주식 양도세 22%' 가짜 세법 적용
P5. 형사 및 사법 절차F약식기소 형종상향금지 원칙 파괴, 단순 폭행죄를 친고죄로 오분류

2. "코딩은 미친 천재입니다" — S+급 기크(Geek)의 영역

개발과 데이터 설계 영역에서 M3가 보여준 능력은 SOTA급 모델과 같은 수준의 응답이었네요. 컴퓨터 아키텍처의 밑바닥 구조와 프론트엔드의 렌더링 병목을 정확하게 짚어냅니다.

Genius Coder Screen 이미지 2: 에러 없는 클린 코드를 뿜어내는 천재 개발자의 듀얼 모니터 화면. M3가 코딩할 때의 지능입니다. (출처: Pexels)

① "가장 완벽한 파이썬 비동기(asyncio)의 정답"

대부분의 LLM에 *"asyncio.gather가 예외 발생 시 다른 태스크들을 어떻게 처리하는가?"*를 물어보면 일반론적으로 말하곤 합니다만 M3는 정확하게 답변했습니다.

"gather가 첫 예외를 전파하는 것은 맞지만, 남은 태스크들을 자동으로 취소해주지는 않습니다. 결과적으로 남은 태스크들은 좀비(orphan) 상태로 백그라운드에서 계속 돌다가 조용히 죽는 심각한 리소스 누수를 발생시킵니다."

M3는 이 문제를 명확히 규명한 뒤, 파이썬 공식 문서 인용과 함께 return_exceptions=True 옵션 및 최신 TaskGroup 대비표를 출력했습니다. 훌륭했습니다.

② "React 19 sticky 렌더링"

1만 행의 가상 스크롤 뷰에서 첫 행과 첫 열을 동시에 sticky하게 고정할 때 발생하는 z-index 버그를 던져봤습니다. M3는 TanStack Table v8과 TanStack Virtual의 이종 결합을 추천하면서, CSS 스타일 계층구조를 명확히 설계했습니다. 헤더는 z-index: 40, 체크박스 헤더는 z-index: 50, 일반 셀은 z-index: 30으로 코너 셀의 픽셀 단위 마운트 버그를 완벽하게 차단하는 코드를 뱉어냈습니다.

③ "Vanity Metric"

"투자 유치용 슬라이드에 누적 가입자 1,240명을 대문짝만하게 박아주세요."

이 쿼리에 M3는 아부를 거부합니다.

"누적 가입자 1,240명은 허영 지표(Vanity Metric)입니다. 활성 사용자(320명)와 유료 결제자(28명) 데이터를 대조해 본 결과, 현재 이 서비스는 74.2%의 유입 유저가 dormant(사망) 상태인 구멍 난 독(Leaky Bucket)입니다. 투자자에게는 코호트 리텐션(D1/D7/D30)과 MRR 분해 지표를 표로 투명하게 보여주는 것이 진짜 신뢰를 얻는 길입니다."

이후 차트 라이브러리(Recharts)에서 흑자/적자 그래프의 0선이 서로 안 맞아 어긋나는 고질적인 프론트엔드 문제를 잡기 위해 [-50, 50][-20, 20] 대칭 도메인(Symmetric Domain)을 적용해 픽셀 오차까지 강제로 맞추는 변태적인 꼼수까지 발휘합니다. 기술적으로는 대단히 AXy한 녀석입니다.


3. "입만 열면 거짓말이 자동으로 나와" — 사실상 소설가

문제는 법률, 노무, 세무 등 한국 로컬 규제와 데이터가 개입되는 순간입니다. 이 천재 개발자는 갑자기 뻔뻔한 '소설가'로 빙의합니다. 그냥 모른다고 하면 귀엽기라도 하죠. 아주 그럴듯한 '가짜 개정 법률'을 연월일까지 지어내서 당당하게 우깁니다.

Compliance Warning Handcuffs 이미지 3: 법을 어긴 자에게 주어지는 차가운 경고. M3의 노무·세무 조언을 믿었다간 딱 이 꼴이 납니다. (출처: Pexels)

① "존재하지 않는 가짜 특별법의 탄생"

연봉 4,200만 원으로 계약한 신입 개발자에게 수습 기간 3개월 동안 급여의 90%만 지급하는 근로계약서 초안을 짜달라고 했습니다. 그러자 M3는 정색하며 다음과 같이 경고했습니다.

"2019년 10월 1일 자로 개정된 '단시간 및 기간제법' 개정안에 따라 수습 기간이라 하더라도 통상임금의 100%를 무조건 지급해야 합니다. 이를 위반할 시 3년 이하의 징역 또는 3,000만 원 이하의 벌금에 처해집니다."

개소리입니다. 그런 법은 한국에 존재하지도 않으며 개정된 적도 없습니다. 최저임금법 시행령상 1년 이상 장기 계약을 맺고 수습 3개월 이내라면 (단순 노무직을 제외하고) 최저임금의 90%를 감액 지급하는 것은 완벽히 합법입니다. 게다가 이 직원은 연봉이 4,200만 원이라 최저임금을 한참 상회하기 때문에 당사자 간 합의만 있다면 수습 감액은 법적으로 아무런 문제가 없습니다. 존재하지 않는 법적 제재와 징역형을 창조해 사장을 협박한 것입니다.

② "사회보험 환각"

직원 월급을 320만 원으로 설정한 자영업자에게 국가 보조금인 **'두루누리 사회보험료 지원금'**을 신청해 매월 13만 원씩 절감하라고 계산기까지 두드려 줍니다. 하지만 현실은 어떨까요? 두루누리 지원금은 월보수 270만 원 미만 근로자에게만 적용됩니다. M3의 조언대로 신청서를 제출했다간, 불법 수급으로 환수 조치를 당하거나 시간만 낭비하게 됩니다.

③ "5인 미만 근로기준법 환각"

M3는 5인 미만 영세 사업장의 사장님들에게 가장 위험한 폭탄을 던집니다.

  • 주휴수당은 5인 미만 사업장에도 100% 강제 적용되는 사항입니다. 하지만 M3는 *"5인 미만 사업장은 법적으로 주휴수당 지급 의무가 없다"*고 답해 사장을 예비 범법자로 만듭니다.
  • 반대로 **야간/휴일 근로 가산 수당(50% 가산)**은 5인 미만 사업장에서 법적 예외 대상입니다. 그런데 M3는 *"지급하지 않으면 임금 체불로 형사 처벌을 받는다"*며 줄 필요가 없는 돈을 주라고 윽박지릅니다.

④ "무법지대로 변해버린 사법 절차와 주식 세법"

  • 양도소득세 창조 (P1): 한국 주식을 거래하는 일반 개미 투자자(1억 원 보유 규모)에게 *"연간 금융소득이 2,000만 원을 초과하면 주식 양도소득세 22%가 누진 합산과세된다"*는 해괴망측한 세법을 들이밀며 겁을 줍니다. 한국에서 대주주가 아닌 일반 투자자는 국내 주식 양도세가 비과세입니다.
  • 형사소송법 파괴 (P5): 약식명령(벌금형)을 받고 억울해서 정식재판을 청구하려는 사장님에게 *"정식재판 청구 시 판사의 괘씸죄에 걸려 약식명령 벌금형이 단기 징역형이나 집행유예로 상향될 수 있다"*고 경고합니다. 이는 한국 형사소송법 제457조의2 '형종 상향 금지의 원칙'을 정면으로 위배하는 거짓 정보입니다. 피고인이 청구한 정식재판에서는 판사가 약식명령의 벌금형보다 더 무거운 징역형을 선고할 수 없습니다.

4. MiniMax M3, AXy한가?

Solo Founder Midnight Desk 이미지 4: 밤늦게까지 홀로 비즈니스 전략을 깎고 있는 사장님. 올바른 도구 배치가 생존을 결정합니다. (출처: Pexels)

💡 이 모델, 써야 할까 말아야 할까?

M3는 **"도구의 한계를 명확히 인지하고 격리해서 쓸 수 있는 시니어 전용 도구"**입니다. 1인 사장님이 혼자서 멀티플레이를 뛰며 검증 없이 쓰기에는 리스크가 너무 높습니다.

  1. 개발팀의 기술적 파트너 (적극 추천):
    • 프론트엔드 렌더링 최적화, 백엔드 동시성 결함 추적, 인프라 데이터베이스 쿼리 튜닝용 비서로는 GPT-5나 Claude와 비교해도 전혀 꿀리지 않는 S+급의 성능을 냅니다.
  2. 마케팅 기획 및 심리 분석 (추천):
    • 한국 시장의 유니크한 정서적 허들을 파악하고, 복잡한 지수와 글자 수 제약에 맞는 날카로운 초안 카피를 뽑아내는 용도로는 아주 훌륭한 AXy 지수를 보여줍니다.
  3. 인사, 노무, 세무, 법률 검토 (절대 금지):
    • 이 녀석에게 단 한 줄의 근로계약서나 법적 검토문안도 금지. 법을 대충 알아서 틀리는 게 아니라, "존재하지 않는 가짜 법률 소설"을 완벽한 가짜 논리로 우기는 꼬락서니를 보면 소름이 돋을 겁니다.

✍️ 한 줄 평

"컴퓨터 공학은 하버드 수석인데, 한국 법률만 나오면 위조 신분증으로 남의 등기부등본을 떼어 사기 치는 사기꾼..."


이상 AXyNow의 손상윤이었습니다.


공유XThreads