ChatGPTがずいぶんと賢くなったので、レポートの評価基準を作って採点を行ってみました
そうすると、
・文字数のカウントは全然違う
・評価基準がぶれる
・同じレポートをあとで評価すると同じ結果にならない
・評価基準とは違う観点で評価する
など、かなり厳しいものになりました
あと、信頼性の問題があるので、ChatGPTが評価した基準を元に自分でも確認する作業が発生しましたので、
あれ? 自分で一からやった方が早くない?
ってことに気づきました
日本語を評価するにはまだまだ使えないってことです
案を出すなら優秀なんですけどね
ここがChatGPTの現時点での評価です




コメント