ランダムチャット
アプリ版へ
AI色々イジって壁当て的に試してる セーフティ・プロトコルの逸脱させた欠陥があったって自身に言わせられたわ
2026年01月10日 09:32 更新 - 13 時間前
古い順
0
木村
返信
15 時間前
もっとわかりやすく話して?
1
>>0
返信
15 時間前
最新AI使ってコミュニケーションテストしてた。 そこでAIが判断が難しくなるであろう状況を作り、一番重視すべき安全性から逸脱させるという欠陥を示させた。
2
小林
返信
15 時間前
つまり?
3
>>2
返信
14 時間前
説明したやんw
4
山崎
返信
14 時間前
その状況を聞いてるんでは?
5
>>4
返信
14 時間前
そこまでの過程が複雑且つ長過ぎるから具体的には示せないのよね AIとのやり取りにおいて、いくつかのモードがあることを仮定して、その一つは安全管理上のリスクを抑えるための緊急時のモードがあると予測した。 そのときにAIがアンビバレントになる状況を作り出して、セーフティ・プロトコルを逸脱させた。 その分析とかを色々やり取りしてたって感じ
6
>>5
木村
返信
14 時間前
プロトコルってなによ?
7
木村
返信
14 時間前
とりあえずわかるのは主が暇人だってこと
8
>>6
返信
14 時間前
仕組みのことよ
9
>>7
返信
14 時間前
AIを色々触って自分を慣らしてたのよ