基于大型語言模型的藥理學考試主觀題智能評分研究
中國醫(yī)學教育技術
頁數(shù): 8 2024-07-17
摘要: 文章探討大型語言模型(large language model,LLM)在藥理學主觀題智能評分中的應用效果。選取ChatGPT 4.0、Claude 2、訊飛星火認知大模型3.0、智譜清言3.0和文心一言3.5五種LLM,通過多種評分標準和提示工程技術,對藥理學短文本類主觀題進行評分。結果顯示,ChatGPT 4.0評分上表現(xiàn)最為出色,平均絕對誤差率(mean absolute...