我自己為了比較各個對話機器人的差異,尤其有些已進入可以深度思考,所以畫了一張圖(如下),想利用以下的題目來測試各個對話機器人的思考結果,分別運用以下不同的提示詞:
提示詞1:如圖中的擺設,如果要把所有杯子收到箱子中,一次只能取一個杯子,人要採用那一種方式,完成的速度會比較快?
提示詞2:如圖中的擺設,如果要把所有杯子收到箱子中,一次只能取一個杯子,如果考量人的體力問題,人要採用那一種方式,完成的速度會比較快?
以下測試僅是比較之用,無學術探討的過程。
1.ChatGPT o1
提示詞1的回應:(二條路線沒差別)
提示詞2的回應: (建議先拿遠的)
2. Gemini(2.0 Flash Thinking Experimental)
提示詞1的回應:(由近而遠取杯較快)
提示詞2的回應:(建議由遠而近取杯子)
3. Copilot(Think Deeper)
提示詞1的回應:(只有說明如何思考解題,並且沒提出答案。)
提示詞2的回應:(也是只有說明如何思考解題,並且沒提出答案。)
4. Claude
提示詞1:(直接回答如果以人的體力做考量,應由遠而近取杯子)
5. Perplexity(Pro)
提示詞1的回應:(建議由近而遠取杯子)
提示詞2的回應:(還是建議由近而遠取杯子)
你也可將問題延伸為:一家在台北的物流公司要送貨至全台灣,是要由近至遠送貨,還是要由遠至近送貨。再讓各個對話機器人測試一下。
文章標籤
全站熱搜