← Back to feed
Papers·3주 전

Neutrosophic Logic 로 LLM 내부 불확실성 모델링 — GPT 계열 35% 에서 hyper-truth 관측

Neutrosophic Logic 로 LLM 내부 불확실성 모델링 — GPT 계열 35% 에서 hyper-truth 관측

OpenAI GPT 모델군(4종)에서 Neutrosophic Logic(T, I, F 세 독립 차원)을 적용해 논리 역설, 무지, 모호함 등 5가지 언어 현상을 분석한 실험 연구입니다. 기존 Softmax 기반 확률 합 제약(T+F+I=1) 대신 T+I+F>1 인 hyper-truth 상태를 허용한 결과, 35% 의 평가에서 hyper-truth 가 관측되었으며 특히 윤리적 모순과 논리 역설에서 두드러졌습니다. 흥미로운 포인트는 이 접근이 모델 내부 갈등을 정량화하고 불확실성을 더 풍부하게 표현할 수 있다는 점입니다. 단, 실험은 GPT-3.5/4 시리즈에 한정되었고 프롬프트 전략에 따른 민감도가 있어 일반화에는 추가 검증이 필요합니다.

Softmax 확률 합 제약이 불확실성을 붕괴시킨다는 문제의식에서 출발해, Neutrosophic Logic 으로 LLM 내부 상태를 더 세밀하게 표현한 실험 연구입니다.

핵심 결론

  • 태스크GPT-3.5/4 계열 4개 모델에 대해 논리 역설, 무지, 모호함, 윤리적 모순, 미래 우연성 등 5가지 현상 평가.
  • 수치Neutrosophic 프롬프트에서 35% 의 평가가 hyper-truth(T+I+F>1) 상태를 보였고, 윤리적 모순과 논리 역설에서 가장 빈번.
  • 비교확률 프롬프트와 엔트로피 기반 프롬프트보다 hyper-truth 관측률이 높았으며, 모호한 맥락에서도 진리값 보존이 우수.

방법

  • Neutrosophic LogicTruth(T), Indeterminacy(I), Falsity(F) 를 독립 차원으로 두고 T+I+F > 1 인 hyper-truth 상태를 허용.
  • 프롬프트 전략Neutrosophic, probabilistic, entropy-derived 세 가지 프롬프트로 각 현상을 유도하고 모델 출력의 T/I/F 값을 추정.
  • 실험은 OpenAI GPT-3.5-turbo, GPT-4, GPT-4-turbo, GPT-4o 등 4개 모델에 대해 수행되었습니다.

한계·조건

  • 모델 범위OpenAI GPT 계열에 한정되어 다른 아키텍처(Llama, Claude 등)로 일반화할 수 있는지는 미검증.
  • 프롬프트 민감도Neutrosophic 프롬프트의 표현 방식에 따라 hyper-truth 관측률이 달라질 가능성이 있습니다.
  • 코드 공개논문에서 코드나 데이터셋 공개 여부는 명시되지 않았습니다.

편집자 한 줄

T+I+F > 1 이라는 조건이 직관적으로는 낯설지만, LLM 의 '모르지만 말은 하는' 특성을 포착하는 데는 꽤 적합해 보입니다. 다만 실험 규모가 작아서 재현성 확인이 필요하네요.

  • #neutrosophic-logic
  • #uncertainty
  • #gpt
  • #interpretability
Maikel Yelandi Leyva-Vázquez
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —