poko

AI

推論モデルが安全配置を劣化させる — 6軸評価で実証 arXiv

arXiv論文(2606.11046)がSFT・強化学習・蒸留で作られた推論モデルを6軸で評価し、推論精度が上がるほど毒性増加・固定観念増幅・拒否誤較正などの配置回帰が起きることを実証しました。推論ベンチマークだけでモデルを選ぶ開発者が増えている今、信頼性評価の欠落が問題になっています。
AI

arXiv:CoT微調整でハイブリッドLLMの長文脈能力が崩壊

ハイブリッドLLMにCoT微調整を施すと長文脈検索が67%から9%に低下する「Attention Amnesia」現象をarXiv(2606.11052)が実証しました。原因はWQ・WKパラメータの破損で、訓練不要なQK-Restore手法で復元できます。
SQL

MySQLのCOUNT 4種類:NULL扱いと使い分けを整理

MySQLの COUNT(*) / COUNT(col) / COUNT(DISTINCT) の違いを実例で解説します。NULL除外・重複排除の仕組みと COUNT(DISTINCT) の性能コストを表付きで整理。
AI

arXiv:画像を推論媒体とするOptical Reasoningが登場

テキスト推論の代わりに画像を推論キャンバスとして使うOptical ReasoningがarXivに公開されました(2606.09585)。言語タスクで推論トークンを28.57%削減しながら同等精度を維持。エージェント推論のAPIコスト削減につながる新アプローチです。
AI

arXiv:RLHFは表層的整合のみ — 党派的偏向は重みに残る

arXiv論文がRLHFによるアライメントの脆弱性を実証しました。LLMは整合後も内部に党派的な偏向構造を保持しており、ユーザーの政治的文脈を与えると偏った出力が再活性化します。他の価値領域にも同様の現象が起きる可能性があります。
AI

arXiv:コンテキスト圧縮モデルLCLM — 長文脈を1/16に縮小

arXiv論文(2606.09659)がコンテキストを最大1/16に圧縮するLCLMを提案しました。0.6Bエンコーダと4Bデコーダを組み合わせ、性能・速度・メモリの3軸でパレート最適を達成。長文脈エージェントやRAGのコスト削減に直結します。
AI

Lovable、ARR $500M達成 — AIコーディングの民主化

ヨーロッパ発のAIコーディングスタートアップLovableがARR$500Mを達成しました。週100万件の新規プロジェクト、累計5000万件超という成長速度は、非技術者がAIでアプリを自前構築するバイブコーディング市場の本格化を示しています。
AI

Anthropic、Claude Fable 5を一般公開 — 最強モデルがAPIで使える

Anthropicが最高位モデルClaude Fable 5を一般公開しました。価格はOpus 4.8の2倍(出力$50/Mトークン)ですが6月22日まで全プランで無料。エージェント・コーディング精度が前世代比10%超向上しています。
SQL

MySQLのDELETE・TRUNCATE・DROPの違いと使い分け

MySQLのDELETE・TRUNCATE・DROPの動作の違いをロールバック・AUTO_INCREMENT・性能の観点から整理します。実例のSQL付きで、どれを使うべきかの判断基準を示します。
AI

Amazon、テキスト指示だけでグッズ作成 — AIデザイン機能を追加

Amazonがテキスト入力だけでオリジナルグッズを注文できるAIデザイン機能を公開しました(米国のみ)。AlexaへのプロンプトでAIが画像を生成し、Tシャツやタンブラーに印刷してPrime配送で届ける仕組みで、Redbubbleなどのカスタムグッズプラットフォームへの本格参入となります。