我自己為了比較各個對話機器人的差異,尤其有些已進入可以深度思考,所以畫了一張圖(如下),想利用以下的題目來測試各個對話機器人的思考結果,分別運用以下不同的提示詞:

提示詞1:如圖中的擺設,如果要把所有杯子收到箱子中,一次只能取一個杯子,人要採用那一種方式,完成的速度會比較快?

提示詞2:如圖中的擺設,如果要把所有杯子收到箱子中,一次只能取一個杯子,如果考量人的體力問題,人要採用那一種方式,完成的速度會比較快?

以下測試僅是比較之用,無學術探討的過程。

問題.png

 

1.ChatGPT o1

提示詞1的回應:(二條路線沒差別)

利用由近而遠或由遠而近取杯的問題測試各個對話機器人的思考結果

提示詞2的回應: (建議先拿遠的)

利用由近而遠或由遠而近取杯的問題測試各個對話機器人的思考結果

 

2. Gemini(2.0 Flash Thinking Experimental)

提示詞1的回應:(由近而遠取杯較快

利用由近而遠或由遠而近取杯的問題測試各個對話機器人的思考結果

提示詞2的回應:(建議由遠而近取杯子

利用由近而遠或由遠而近取杯的問題測試各個對話機器人的思考結果

 

3. Copilot(Think Deeper)

提示詞1的回應:(只有說明如何思考解題,並且沒提出答案。)

利用由近而遠或由遠而近取杯的問題測試各個對話機器人的思考結果

提示詞2的回應:(也是只有說明如何思考解題,並且沒提出答案。)

利用由近而遠或由遠而近取杯的問題測試各個對話機器人的思考結果

 

4. Claude

提示詞1:(直接回答如果以人的體力做考量,應由遠而近取杯子)

利用由近而遠或由遠而近取杯的問題測試各個對話機器人的思考結果

 

 

5. Perplexity(Pro)

提示詞1的回應:(建議由近而遠取杯子)

利用由近而遠或由遠而近取杯的問題測試各個對話機器人的思考結果

提示詞2的回應:(還是建議由近而遠取杯子)

利用由近而遠或由遠而近取杯的問題測試各個對話機器人的思考結果

你也可將問題延伸為:一家在台北的物流公司要送貨至全台灣,是要由近至遠送貨,還是要由遠至近送貨。再讓各個對話機器人測試一下。

學不完.教不停.用不盡文章列表

arrow
arrow
    創作者介紹
    創作者 vincent 的頭像
    vincent

    學不完.教不停.用不盡

    vincent 發表在 痞客邦 留言(0) 人氣()