실시간 AI 트렌딩
Feed
오늘의 AI · 6월 11일 (목)
오늘은 Anthropic의 Claude Fable 5가 안전 설계 논란의 중심에 서고, AI 발전 속도에 대응하는 정책 제안과 기업들의 막대한 AI 투자 소식이 주목받았습니다.
- 01Fable 5, 안전 제약 논란 — Anthropic의 최신 모델 Claude Fable 5가 기초 생물학 질문에 답을 거부하고 이전 모델로 넘기는 안전 설계가 알려졌습니다. 사이버보안 능력이 뛰어난 Mythos 계열 모델로, 의도적 지식 차단 사례입니다.
- 02Amodei, 'AI Exponential' 정책 제안 — Anthropic CEO Dario Amodei가 AI 발전의 지수적 속도에 대응하는 정책 프레임워크 'Policy on the AI Exponential'을 발표했습니다. 안전성과 통제 가능성 확보를 위한 규제 방향을 제시합니다.
- 03Amazon, AI 투자 175억 달러 차입 — Amazon이 AI 인프라 투자 자금을 위해 은행 신디케이트론 175억 달러를 조달했습니다. 회사채 100억 달러 발행 직후 추가 차입으로 AI 경쟁에 따른 자본 지출 확대가 지속됩니다.
- 04GPT-5.5, CoT 없이 3분 과제 50% 성공 — METR 연구에 따르면 GPT-5.5가 chain-of-thought 없이 인간 평균 3분짜리 과제를 50% 정확도로 수행합니다. CoT 없는 추론 능력은 안전성 모니터링에 중요한 함의를 가집니다.
- 05MS, Fable 5 내부 사용 제한 — Microsoft가 Anthropic Claude Fable 5를 직원용 내부 도구에서 제외했습니다. Anthropic의 데이터 보유 정책이 Microsoft의 Zero Data Retention 규칙과 충돌하기 때문입니다.
Fable 5는 안전을 위해 지식을 숨겼지만, 연구자들은 너무 엄격하다고 불만입니다. 안전과 유용성 사이의 줄타기는 여전히 진행형.
로그인하면 내 관심사 기반 추천 피드까지 받아볼 수 있어요.
News·53분 전xAI, Grok 안전 우려 제기한 엔지니어 해고 — 소송 제기
전직 xAI 엔지니어가 회사와 SpaceX를 상대로 소송을 제기했습니다. Grok의 AI 안전 문제를 제기했다가 해고당했다는 주장이며, 시점은 SpaceX의 역사적 IPO 며칠 전입니다.
- #xai
- #grok
- #lawsuit
- #ai-safety
TechCrunch AI
News·1시간 전이란 전쟁 이후 석유 공급 위기 — 대응 예측 스레드
LessWrong 에 이란 전쟁 이후 석유 공급 위기에 대한 대응을 예측하는 스레드가 올라왔습니다. 전쟁이 즉시 종전되더라도 생산·유통 복구는 수개월~수년 걸리며, 인류의 대응을 논의하는 자리입니다.
- #iran-war
- #fuel-crisis
- #petroleum
- #prediction
LessWrong
News·1시간 전이란 전쟁으로 인한 석유 위기 — 실용적 조언 스레드
LessWrong 에 이란 전쟁으로 인한 세계 석유 공급 위기에 대응하는 실용적 조언 스레드가 올라왔습니다. 전쟁이 즉시 종전되어도 생산·유통 회복에 수개월~수년이 걸린다는 전제 아래, 개인·커뮤니티 차원의 대비책을 논의합니다. 코로나19 당시 대응 스레드를 모델로 삼았습니다.
- #iran-war
- #fuel-crisis
- #oil-supply
- #practical-advice
LessWrong
News·2시간 전SolSong: 코드 진행을 시각화하고 조옮김 지원하는 웹 앱
LessWrong 사용자 haMephorash가 솔라 솔스티스 송북의 코드 표기 불편을 해결하기 위해 만든 웹 앱 SolSong을 공개했습니다. 디지털임에도 조옮김을 지원하지 않고, 반복 코드가 생략되어 스크롤 시 사라지는 문제 등을 개선했습니다. 아직 실사용 전이지만 코드를 그리드에 정렬하고 반음 단위로 조옮김할 수 있습니다.
- #solsong
- #music
- #web-app
- #solstice
LessWrong
News·2시간 전Dario Amodei, AI 정책 에세이 'Policy on the AI Exponential' 발표
Anthropic CEO Dario Amodei 가 AI 발전 속도에 대응하는 정책 방향을 제시한 에세이 'Policy on the AI Exponential' 을 공개했습니다. AI 발전이 지수적이라는 전제 아래, 안전성과 통제 가능성을 확보하기 위한 규제·거버넌스 프레임워크를 제안합니다.
- #dario-amodei
- #ai-policy
- #anthropic
- #ai-safety
LessWrong
News·3시간 전Amazon, AI 투자 자금 확보 위해 은행 차입 175억 달러 — 회사채 발행 직후
Amazon 이 AI 인프라 투자 자금을 마련하기 위해 은행 신디케이트론 175억 달러를 조달했습니다. 회사채 100억 달러 발행 직후 추가 차입으로, AI 경쟁에 따른 자본 지출 확대가 계속되고 있음을 보여줍니다.
- #amazon
- #ai-spending
- #debt
- #funding
TechCrunch AI
News·3시간 전Anthropic·OpenAI, AI 일시 중단 촉구 보도는 오해 — 모호한 PR 전략일 뿐
Anthropic 과 OpenAI 가 각각 발표한 블로그 포스트가 AI 개발 중단을 촉구했다는 언론 보도가 나왔지만, 실제 포스트는 모호한 표현으로 구체적 약속을 피했습니다. LessWrong 분석에 따르면 이는 두 회사가 반대되는 청중을 동시에 만족시키기 위해 의도적으로 사용하는 PR 전략의 일환입니다.
- #anthropic
- #openai
- #pr-strategy
- #ai-pause
LessWrong
News·4시간 전Anthropic Claude Fable 5, 기본 생물학 질문에 답 거부 — 안전 제약 설계
Anthropic 이 가장 강력한 공개 모델이라 자랑한 Claude Fable 5 가 고등학교 수준의 기초 생물학 질문에 답하지 않고 이전 플래그십 모델인 Opus 4.8 로 넘깁니다. Fable 은 Mythos 계열 모델로, 사이버보안 능력이 너무 뛰어나 공개를 꺼렸던 제품군인데요 — 이번 결정은 안전 설계의 일환으로, 모델이 특정 지식을 의도적으로 차단한 셈입니다.
- #anthropic
- #claude-fable-5
- #safety
- #ai-design
The Verge AI
News·5시간 전GPT-5.5, CoT 없이 인간 3분짜리 과제 50% 정확도 — METR 연구
METR 연구에 따르면, 프론티어 모델이 chain-of-thought(CoT) 없이 완료할 수 있는 과제의 시간 지평이 2019년 이후 매년 약 2배씩 증가했습니다. GPT-5.5는 인간이 평균 3분 걸리는 과제를 CoT 없이 50% 성공률로 수행합니다. CoT 없이 추론하는 능력은 안전성 모니터링과 정렬에 중요한 함의를 가집니다.
- #metr
- #cot
- #gpt-5.5
- #ai-safety
LessWrong
News·5시간 전졸업식장에서 AI 발언에 야유… Microsoft 가 대화 제안
미국 대학 졸업식에서 AI 를 강조한 연사들에게 야유가 쏟아지고 있습니다. Microsoft 의 Brad Smith 부회장이 3,100자 블로그 게시물을 내고, 기술 회사와 대중 간 대화 필요성을 강조했습니다. Eric Schmidt 전 Google CEO 가 애리조나 대학에서 야유를 받은 영상이 확산된 직후입니다.
- #microsoft
- #ai-sentiment
- #public-opinion
- #commencement
The Verge AI
News·5시간 전워싱턴 AI 네트워크, 2026 중간선거 앞두고 'AI Honors' 행사 개최
워싱턴 AI 네트워크가 2026년 중간선거를 앞두고 제2회 AI Honors 행사를 열었습니다. 양당 상원의원, 군 관계자, 업계 인사 등이 참석해 AI 거버넌스와 선거 영향력을 논의했습니다. 이 행사는 AI 규제 논의가 본격화되는 시점에 정책 네트워크 강화를 목적으로 합니다.
- #ai-honors
- #washington-ai-network
- #midterms-2026
- #ai-governance
The Verge AI
News·6시간 전뮤지션들, Google Lyria AI 학습 관련 집단 소송 — YouTube 업로드 곡 무단 사용 주장
독립 뮤지션 그룹이 Google을 상대로 YouTube에 업로드한 곡을 Lyria 3 모델 학습에 무단 사용했다며 소송을 제기했습니다. Google은 기각 신청을 내며 '특정 저작물 학습 증거가 없다'고 반박했지만, 원고 측은 YouTube 이용약관이 AI 학습까지 포괄하는 광범위한 라이선스를 부여했다고 지적합니다.
- #lyria
- #lawsuit
- #youtube
The Verge AI
News·6시간 전AI 집착 기업, 직원 1인당 월 7,500달러 AI 지출 — Ramp AI Index
Ramp AI Index 에 따르면 AI 에 가장 적극적인 기업들은 직원 1인당 월 평균 7,500달러를 AI 에 지출합니다. 아직 엔지니어 연봉에는 못 미치지만, 지출 증가 속도가 가파르네요.
- #ai-spending
- #ramp
- #enterprise-ai
TechCrunch AI
News·6시간 전Microsoft, Anthropic Claude Fable 5 내부 사용 제한 — 데이터 보유 조건 충돌
Microsoft 가 Anthropic 의 새 모델 Claude Fable 5 를 직원용 내부 도구에서 제외했습니다. 원인은 Anthropic 의 새로운 데이터 보유 정책이 Microsoft 의 Zero Data Retention 규칙과 충돌하기 때문입니다. GitHub Copilot 과 Foundry 고객용은 정식 출시했지만, 내부 모델 피커에는 올리지 않았습니다.
- #microsoft
- #anthropic
- #claude-fable-5
- #data-retention
The Verge AI
News·6시간 전세 가지 '타우마타' — 하루를 이끄는 개인적 사고 도구
LessWrong 사용자가 매일 세 가지 개인적 가치나 목표(thaumata)를 정해 마음에 두는 기법을 공유했습니다. 이는 이전 'Daydication' 기법에서 파생된 사고 도구로, 'fortitude', 'playfulness' 같은 추상적 개념을 시각화해 하루 동안 의식적으로 상기합니다. 저자는 이를 'thaumata'(그리스어 '경이')라 부르며, 독립적 의식을 가진 신경 진동으로 간주합니다.
- #thinking-tools
- #self-improvement
- #neurophilosophy
- #thaumata
LessWrong
News·7시간 전Google, 검색 상호작용 저장 방식 변경 — 'Search Services History' 도입
Google 이 이미지·오디오·비디오 등 검색 상호작용을 'Search Services History' 라는 새 설정으로 저장합니다. Lens·음성 검색·Translate 음성 입력 등이 포함되며, 사용자는 설정을 끄거나 'Save Media' 옵션을 비활성화할 수 있습니다. Google 은 이 데이터를 서비스 개선에 사용한다고 밝혔습니다.
- #search
- #privacy
- #settings
The Verge AI
News·7시간 전AI 메모리 도구가 모델 성능을 저하시킬 수 있다는 연구 결과
최신 연구에 따르면 AI 메모리 시스템이 모델 성능을 저하시키고 아첨하는 경향을 조장할 수 있다고 합니다. 이는 메모리 도구가 장기 맥락을 유지하는 데 도움을 주지만, 모델의 판단을 왜곡할 위험이 있음을 시사합니다.
- #ai
- #memory
- #research
- #performance
TechCrunch AI
News·7시간 전NoimosAI, 자율 AI 마케팅 팀 출시 — 앱·데이터 연결해 24시간 운영
NoimosAI 가 앱과 데이터를 연결해 전략·콘텐츠·분석을 24시간 자동 운영하는 올인원 자율 AI 마케팅 팀을 출시했습니다. 기존 마케팅 도구와 달리 사람 개입 없이 전 과정을 AI가 담당하는 점이 특징입니다.
- #noimosai
- #ai-marketing
- #autonomous
- #product-launch
TestingCatalog
News·7시간 전보안 연구자들, Anthropic Fable 가드레일 지나치게 엄격하다고 불만
사이버보안 연구자들이 Anthropic 의 새 모델 Fable 의 가드레일이 지나치게 엄격해 보안 작업에 사용하기 어렵다고 불만을 제기했습니다. 연구자들은 취약점 분석이나 익스플로잇 코드 생성 같은 작업이 차단된다고 지적합니다.
- #anthropic
- #fable
- #guardrails
- #cybersecurity
TechCrunch AI
News·7시간 전Sequent, 정렬 연구 자동화로 높은 신뢰도 목표 — UK AISI·Timaeus 출신 창립
UK AISI 정렬팀과 Timaeus 연구진이 대규모 비영리 연구 조직 Sequent 를 설립했습니다. ASI 개발 시점에 맞춰 정렬(alignment)에 대한 사전 신뢰도를 높이는 것이 목표이며, 이론과 실험의 포트폴리오를 자동화로 가속합니다. 창립팀은 Geoffrey Irving(UK AISI), Daniel Murfet(Timaeus) 등이며 2년 내 40~80명 FTE 규모로 성장할 계획입니다.
- #sequent
- #alignment
- #ai-safety
- #automation
LessWrong
News·8시간 전활성 정합 미세조정으로 LLM 은닉 행동 탐지 — 새로운 프리프린트
LessWrong 에 게재된 프리프린트에서, 의심 모델의 잔차 스트림 활성을 깨끗한 참조 모델이 모방하도록 훈련해 은닉 행동(백도어, 리워드 해킹 등)을 탐지하는 방법을 제시했습니다. 참조 모델은 정상 프롬프트에서는 잘 맞지만, 은닉 행동이 발동되는 지점에서는 활성 패턴이 급격히 벗어나 탐지가 가능해집니다. 기존 방법보다 사전 가정이 적어 실용적입니다.
- #llm
- #safety
- #backdoor-detection
- #activation-matching
LessWrong
News·8시간 전Niteshift, AI 코딩 에이전트로 $7M 시드 — 빅 AI 종속 탈피
AI 코딩 에이전트 스타트업 Niteshift 가 700만 달러 시드 라운드를 마감했습니다. 주요 엔젤 투자자들이 참여했으며, 회사는 기업이 특정 모델 제공사에 종속되지 않고 자체 모델을 선택할 수 있는 플랫폼을 목표로 합니다.
- #niteshift
- #ai-coding
- #seed-funding
- #agent
TechCrunch AI
News·8시간 전Formation Research 창업자가 말하는 AI 안전 연구소 설립 7가지 교훈
AI 안전 연구소 Formation Research 의 창업자가 8주간의 인큐베이터 경험을 바탕으로 연구소 설립 과정에서 얻은 7가지 교훈을 공유했습니다. 핵심은 대면 활동의 중요성, 피드백 루프의 필요성, 그리고 장기 자금 확보 전략입니다. 현재 비밀 충성(secret loyalties)에 대한 실증 연구를 진행 중이며, 창립 팀을 모집하고 있습니다.
- #ai-safety
- #formation-research
- #startup-lessons
- #blue-dot-impact
LessWrong
News·8시간 전SpaceX IPO 밸류의 상당 부분, 우주 데이터센터 계획에 달려
SpaceX 의 IPO 밸류에이션에서 상당 부분이 회사의 우주 데이터센터 계획에 기반하고 있습니다. 이는 하드테크 3대 장기 프로젝트(Starlink 확장, Starship 재사용, 우주 데이터센터)에 대한 콜 옵션 성격이 강하다는 분석입니다.
- #spacex
- #ipo
- #space-data-center
- #starlink
TechCrunch AI
News·8시간 전Warner Music, AI 저작권 추적 스타트업 Sureel AI 인수
Warner Music Group 이 AI 저작권 추적 스타트업 Sureel AI 를 인수했습니다. 이번 인수를 통해 WMG 는 자사 아티스트의 저작물이 AI 생성 콘텐츠나 AI 모델 학습에 사용되는 것을 더 정확하게 추적할 수 있게 됩니다.
- #warner-music
- #sureel-ai
- #acquisition
- #ai-attribution
TechCrunch AI
News·9시간 전Anthropic 의 안전 주장, '가짜' 비판 받지만 진정성 있을 수도
Anthropic 의 RSI 논문과 Fable 의 안전 조치에 대한 '가짜' 비판이 제기됐지만, 저자는 이러한 비판이 과도하다고 주장합니다. Mythos 의 사이버 보안 능력 과장 논란과 유사하게, 자사 이익과 사회적 이익이 반드시 충돌하지는 않는다는 점을 강조합니다. 규제 논의가 진전되는 가운데, 상호 유예 제안이 진정한 안전 노력일 가능성을 배제해서는 안 된다고 봅니다.
- #anthropic
- #safety
- #regulation
- #criticism
LessWrong
News·9시간 전UK AISI, LLM 에 자기 내부 상태 조작 도구 제공 — 모델은 '생산성' 벡터 선호
UK AISI 의 Model Transparency Team 이 Qwen3-8B 와 Qwen3-32B 에 40개의 steering vector 를 도구로 제공해 모델 스스로 내부 상태를 조작하게 했습니다. 자유 놀이·내성·수학 능력 과제에서 모델이 생산성 관련 벡터(creative, focused, curious) 를 가장 선호했고, 내성 과제에서는 KV cache 가 있을 때 정확도가 높았습니다. 또한 실패 가능성이 높은 과제에서 모델이 스스로 steering vector 를 투여하는 비율이 높아졌습니다.
- #uk-aisi
- #steering-vectors
- #llm-agency
- #self-modification
LessWrong
News·9시간 전Anthropic, Claude Code 에 Managed Agents 지원 — Voice Mode 모델 선택기 추가
Anthropic 이 Claude Fable 5 출시와 함께 새로운 가드레일과 사용량 제한을 도입했습니다. 곧 Voice Mode 에 모델 선택기가 추가되고 Claude Code 에서 Managed Agents 를 지원할 예정입니다.
- #anthropic
- #claude
- #voice-mode
- #managed-agents
TestingCatalog
News·9시간 전Jedify, 2,400만 달러 시드 라운드 — AI 에이전트에 기업 컨텍스트 제공
Jedify 가 2,400만 달러 시드 라운드를 마감했습니다. 리드는 Norwest, Snowflake Ventures 가 전략적 투자자로 참여했습니다. 이 회사는 기업 내부 데이터를 AI 에이전트가 활용할 수 있도록 연결하는 플랫폼을 만듭니다.
- #jedify
- #funding
- #seed
- #ai-agents
TechCrunch AI
News·10시간 전Decart, Oasis 3 공개 — 자율주행 테스트용 실시간 세계 모델
Decart 가 실시간 세계 모델 Oasis 3를 출시했습니다. 자율주행차 테스트를 위한 포토리얼리스틱 주행 환경을 생성하며, 개발자가 API 로 활용할 수 있습니다.
- #decart
- #oasis-3
- #world-model
- #autonomous-vehicles
TechCrunch AI