記事一覧
3件
Introducing LifeSciBenchmedium
LifeSciBenchは、AIシステムが実世界のライフサイエンス研究タスクや意思決定をどう処理するかを評価するための、専門家が作成・審査したベンチマークとして発表された。生命科学分野におけるAI評価の標準化を目指すもので、研究者や製薬・バイオテック企業のAI開発者に影響を与える可能性がある。専門家監修による高品質なベンチマークとして、ライフサイエンスAIの信頼性評価に貢献することが期待される。
OpenAI BlogベンチマークライフサイエンスAI評価バイオテック研究
OpenAIとMolecule.oneが、GPT-5.4を活用したほぼ自律型のAI化学者が医薬品製造における重要な反応を改善したと発表した。これは創薬・医薬品化学研究の自動化における大きな前進を示す事例であり、AIエージェントが実際の科学的実験・最適化タスクを自律的に遂行できる可能性を示している。製薬・化学業界の研究者や開発者に直接的な影響を与えるとともに、科学分野全般におけるAIエージェント活用のトレンドを牽引する。
OpenAI BlogAIエージェント創薬医薬品化学GPT-5自律型AI科学研究
OpenAIは「Deployment Simulation(デプロイメントシミュレーション)」を発表。実際の会話データを活用してAIモデルのデプロイ前に挙動を予測する手法で、安全性評価の精度向上を目指す。リリース前のリスク評価プロセスを改善するこの手法は、AI安全性研究に取り組む研究者や企業に直接影響を与える可能性がある。
OpenAI BlogOpenAIAI安全性評価手法デプロイメントシミュレーション