Papers·3주 전
Neutrosophic Logic 로 LLM 내부 불확실성 모델링 — GPT 계열 35% 에서 hyper-truth 관측

OpenAI GPT 모델군(4종)에서 Neutrosophic Logic(T, I, F 세 독립 차원)을 적용해 논리 역설, 무지, 모호함 등 5가지 언어 현상을 분석한 실험 연구입니다. 기존 Softmax 기반 확률 합 제약(T+F+I=1) 대신 T+I+F>1 인 hyper-truth 상태를 허용한 결과, 35% 의 평가에서 hyper-truth 가 관측되었으며 특히 윤리적 모순과 논리 역설에서 두드러졌습니다. 흥미로운 포인트는 이 접근이 모델 내부 갈등을 정량화하고 불확실성을 더 풍부하게 표현할 수 있다는 점입니다. 단, 실험은 GPT-3.5/4 시리즈에 한정되었고 프롬프트 전략에 따른 민감도가 있어 일반화에는 추가 검증이 필요합니다.
Softmax 확률 합 제약이 불확실성을 붕괴시킨다는 문제의식에서 출발해, Neutrosophic Logic 으로 LLM 내부 상태를 더 세밀하게 표현한 실험 연구입니다.
핵심 결론
- 태스크 — GPT-3.5/4 계열 4개 모델에 대해 논리 역설, 무지, 모호함, 윤리적 모순, 미래 우연성 등 5가지 현상 평가.
- 수치 — Neutrosophic 프롬프트에서 35% 의 평가가 hyper-truth(T+I+F>1) 상태를 보였고, 윤리적 모순과 논리 역설에서 가장 빈번.
- 비교 — 확률 프롬프트와 엔트로피 기반 프롬프트보다 hyper-truth 관측률이 높았으며, 모호한 맥락에서도 진리값 보존이 우수.
방법
- Neutrosophic Logic — Truth(T), Indeterminacy(I), Falsity(F) 를 독립 차원으로 두고 T+I+F > 1 인 hyper-truth 상태를 허용.
- 프롬프트 전략 — Neutrosophic, probabilistic, entropy-derived 세 가지 프롬프트로 각 현상을 유도하고 모델 출력의 T/I/F 값을 추정.
- 실험은 OpenAI GPT-3.5-turbo, GPT-4, GPT-4-turbo, GPT-4o 등 4개 모델에 대해 수행되었습니다.
한계·조건
- 모델 범위 — OpenAI GPT 계열에 한정되어 다른 아키텍처(Llama, Claude 등)로 일반화할 수 있는지는 미검증.
- 프롬프트 민감도 — Neutrosophic 프롬프트의 표현 방식에 따라 hyper-truth 관측률이 달라질 가능성이 있습니다.
- 코드 공개 — 논문에서 코드나 데이터셋 공개 여부는 명시되지 않았습니다.
편집자 한 줄
T+I+F > 1 이라는 조건이 직관적으로는 낯설지만, LLM 의 '모르지만 말은 하는' 특성을 포착하는 데는 꽤 적합해 보입니다. 다만 실험 규모가 작아서 재현성 확인이 필요하네요.
- #neutrosophic-logic
- #uncertainty
- #gpt
- #interpretability
Maikel Yelandi Leyva-Vázquez