📰 2026-05-04
取得フィード数: 7 新着記事: 105件 ピックアップ: 37件
⭐ 注目記事
-
Kimi K2.6 just beat Claude, GPT-5.5, and Gemini in a coding challenge — 中国Moonshot AIが開発したオープンウェイトモデルKimi K2.6がコーディングベンチマークでClaude・GPT-5.5・Geminiを上回り、クローズドモデルに対抗する水準に達した。
-
【緊急】Cursorに「git clone」するだけでPCが乗っ取られる脆弱性!CVSS 9.9のヤバすぎる攻撃手法 — 2026年4月28日公開。悪意のあるリポジトリをgit cloneするだけで任意コード実行が可能なCVSS 9.9の脆弱性。Cursor 2.5以上へのアップデートで対処される。
-
「AIが数学の未解決問題を解いた」報告ラッシュ、リーマン予想もいずれ… 高まる思考力、疲れ知らずの働き者。人間に残された仕事は? — 2026年初頭からAIが長年未解決の数学定理を証明する論文が相次ぎ、専門家は2026年をAIが数学未解決問題を安定的に解ける最初の年と位置づけている。
-
OpenAI’s o1 correctly diagnosed 67% of ER patients vs. 50-55% by triage doctors — Harvardのトライアルで、o1が救急トリアージ診断においてトリアージ医師(正答率50〜55%)を上回る67%の正答率を達成した。
-
AIは学習データを使い果たしつつある可能性、スタンフォード大学報告書が警告 — AIモデルの訓練に使える実データが今後6年以内に枯渇するリスクをスタンフォード大の年次AIレポートが指摘。高品質データの供給制約が今後のモデル進化のボトルネックになりうると分析している。
🤖 生成AI・LLM
-
Refusal in Language Models Is Mediated by a Single Direction — LLMの拒否応答が潜在空間の単一方向ベクトルで制御されていることを示した研究。この方向を介入・編集すると拒否挙動を操作できることが確認されている。
-
AIモデルに「あなたは熟練プログラマーです」と伝えるとかえってプログラマーとしての能力が低下する — arXivに掲載された研究で、専門家ペルソナを付与するプロンプトがコーディングタスクのLLM性能を下げる場合があることが実験的に検証された。
-
ローカルLLM 6モデルサイズ別比較:gemma3 / qwen3 / gpt-oss をOllamaで実測 — Ollamaで動かす3ファミリー・6サイズのLLMを5カテゴリのユースケースで定量ベンチマーク。モデル・サイズ選定の参考となる実測データを公開。
-
AIは速度を前払いし、失敗を後払いにする|Kosuke Kuzuoka — Opsera社が25万人のエンジニアを分析したレポートを基に、AI支援開発が初速を上げる一方で技術的負債や不具合を後工程に押し込む構造を論じた記事。
🦾 AIエージェント・AI開発
-
The agent harness belongs outside the sandbox — AIエージェントのオーケストレーション層(ハーネス)はサンドボックス内部ではなく外部に配置すべきという設計原則を論じた記事。セキュリティとコントロールの分離が根拠となっている。
-
Specsmaxxing – On overcoming AI psychosis, and why I write specs in YAML — AIが独断で実装を変えてしまう「AI心理症」を、仕様をYAML形式で構造化して与えることで克服したアプローチを解説。
-
Flue — The Agent Harness Framework — TypeScriptベースのAIエージェントハーネスフレームワーク。SDKではなくプログラマブルなハーネスとして、一度書けば複数環境にデプロイ可能な設計が特徴。
-
AIエージェントを会社で使いたい!→「え、セキュリティどうするの?」 企業導入への技術的アプローチ — Claude Code/Cursor/CopilotなどのアIエージェントを企業チームに導入する際のセキュリティ対応を技術的に整理した解説記事。
-
Playwright CLI で AI エージェントに視覚的なフィードバックを与える — Playwright CLI v0.1.9で追加されたアノテーション機能を使い、ブラウザ要素の選択とコメント付与でAIエージェントがDOM操作しやすくなる手法の解説。
-
SKILL.md AGENTS.md AgentSkills 完全整理ノート(備忘録) — AGENTS.md・CLAUDE.md・GEMINI.md・SKILL.mdといったAIコーディングツール向けファイルの役割と使い分けを整理した記事。常時読み込みと必要時読み込みの分類が中心。
-
AWS Security AgentでAIによるレビューとペネトレーションテストをやってみた — re:Invent 2025でプレビュー・2026年3月にGAとなったAWS Security Agentを脆弱なFastAPIアプリに対して試し、設計レビュー・コードレビュー・ペネトレーションテストの3機能を実測したレポート。
-
n8n-mcp — Claude/Windsurf/Cursor向けにn8nのワークフロー自動化をMCP(Model Context Protocol)経由で利用できるOSSサーバー。GitHub Trendingで急上昇中(19,251スター)。
-
Codex + Godotで一発生成、ポン出しすると、どのくらいゲームになるのか — CodexとGodotを組み合わせてゲーム企画書から実装・テスト・Webエクスポートまでを同一セッションで試したレポート。完成度とリミットを実測している。
🔧 開発ツール・DX
-
VSCode 1.118 のアップデートがアツすぎ — 2026年4月29日リリースのVSCode 1.118はGitHub Copilotのトークン効率改善など実用性が大幅に向上。料金値上げのインパクトを相殺するレベルの充実度との評価。
-
Electronという天井を自ら壊した:AtomのチームがZed 1.0で証明した5年間の賭け — コードエディタZedがElectronを排してRust+GPU描画で高速化を実現した技術的経緯と、AI機能搭載で1.0をリリースするまでの5年間を振り返る記事。
-
[git] worktree をフル活用するために bare repository を使う — git worktreeをbare repositoryと組み合わせてAIコーディング時の並列作業を効率化するセットアップ方法の解説。
-
SKILL.mdを使っている人は全員”gh skill”も知っておいてください — 2026年4月16日のGitHub CLIアップデートで追加されたSKILL.md管理コマンド「gh skill」を解説した記事。
-
GitHub Apps, GITHUB_TOKEN, OAuth Apps, PATの使い分けフローチャート — GitHubの各種トークン種別(GitHub Apps/GITHUB_TOKEN/OAuth/PAT)の特徴と使い分けをフローチャートで整理。歴史的経緯から生じた複雑性を視覚的に整理した資料。
-
Why TUIs Are Back — GUIが主流の中でTUI(テキストユーザーインターフェース)が再評価されている背景と理由を論じた記事。AIコーディングエージェントによる需要増との関係も言及。
-
従来のユーザーインターフェースが消えていく–「使い捨て」UIの到来 — SalesforceがAPI・MCP・CLIとしてプラットフォームを提供する「Headless 360」を発表。エージェントがUIなしに業務システムを操作するアーキテクチャが現実化している。
☁️ クラウド・インフラ・SRE
-
The invisible engineering behind Lambda’s network — AWSのLambda関数が利用するネットワーク基盤(VPC設計・接続管理・コールドスタート最適化)の内部構造をAllThingsDistributedが解説した記事。
-
Gateway API v1.5: Moving features to Stable — Kubernetes Gateway APIのv1.5が公開。複数の機能がStableに昇格し、本番導入の基準が引き上げられた。
-
Introducing Pyroscope 2.0: faster, more cost-effective continuous profiling at scale — Grafanaの継続的プロファイリングツールPyroscope 2.0がリリース。処理速度とコスト効率が大幅に向上し、大規模環境での運用が改善された。
-
Approaches to tenancy in Postgres — PlanetScaleによるPostgreSQLのマルチテナント設計アプローチの比較解説。スキーマ分離・行レベルセキュリティ・DB分離など各手法のトレードオフを整理。
-
Impacts of updates in open-source databases — PerconaによるオープンソースDBアップデートがシステムに与えるインパクトの分析。MySQL・PostgreSQL等の更新時の影響を検証した記事。
-
Test network paths with TCP, UDP, and ICMP in Datadog — DatadogでTCP/UDP/ICMPを使ったネットワークパステストが可能になった新機能の紹介。ネットワーク品質の可視化と障害診断に利用できる。
-
Managing software license lifecycles: the SLLM journey — LinkedInがOSSライセンスのライフサイクル管理を自動化するSLLM(Software License Lifecycle Management)システムを構築した事例。大規模依存関係の追跡と法的リスク管理が目的。
🎵 音楽・音楽制作ツール
-
teenage engineering EPシリーズを深掘りするイベントが今週金曜日(5月8日)、東京・祐天寺で開催…… TE本社からも担当者が来日、入場無料 — teenage engineeringのEPシリーズに特化したイベントが5月8日に東京・祐天寺で開催。本社スタッフも来日参加し、入場無料。
-
Link Audio, now in Max, Pd, VCV Rack, TouchDesigner, oF, and plug-ins, free — AbletonのLink AudioがMax・Pd・VCV Rack・TouchDesignerなど複数環境に対応し無償提供。Ableton Live 12.4のリリースに合わせた拡張で、Live以外でもリンク機能が使えるようになる。
📰 テック・その他
-
Metal Gear Solid 2’s source code has been leaked on 4chan — メタルギアソリッド2のPS Vita向けHD版ソースコードとアセットが4chanに流出。移植プロジェクトに関わった人物によるリークとされる。
-
3Dプリンターに検閲ソフトを義務づける法案を「オープンソース文化を破壊する恐れがある」としてEFFが批判 — カリフォルニア州法案A.B. 2047が全3Dプリンターに印刷ブロック機能の搭載を義務付けるだけでなく、オープンソース代替ソフトの使用まで犯罪化する恐れがあるとEFFが警告。
-
Maryland Is First to Ban A.I.-Driven Price Increases in Grocery Stores — メリーランド州がAIを活用した食料品の監視型価格設定(サーベイランス・プライシング)を禁止する米国初の法律を制定。
-
Open source does not imply open community — オープンソースライセンスを採用していることとコミュニティへの開放性は別物であり、後者はプロジェクトの明示的な意思決定によって規定されるという議論。
| _フィード最終取得: 2026-05-04 08:20 (JST) | 対象期間: 過去24時間_ |