2025 (最新實測) 免費 AI 聊天機器人評比實測,哪個最好用?

2025 (最新實測) 免費 AI 聊天機器人評比實測,哪個最好用?

還在找哪個免費聊天機器人比較好用?又或是你是小編或企劃,有被逼著產文、報告和找圖的痛苦,雖然自己有常用的聊天機器人,但礙於免費版,總覺得常常得不到滿意的答案?。

本篇,是大叔自己使用頻率最高的幾個免費聊天機器人,進行測試後的心得,分享給大家究竟哪一個最好用。嫌文章太長的朋友,可直接拉到最後看結論。

無論你有沒有常用喜歡的 AI 聊天機器人,你也可以跳去閱讀,我在2025十月寫這篇(如下按鈕),也能協助你了解這些聊天機器人的性格,快速幫你挑選你需要的 AI 工具。

你最愛的 AI 聊天機器人是誰? 用七個電影角色 完全剖析 AI 性格! !

一、你可能不知道的 6 大免費聊天機器人 ,哪個最好用?

以下這幾個是大叔平常在進行文案工作,最常用的 6 個免費聊天機器人 ,所採用的測試的版本包含:

最早推出大家耳熟能詳的 ChatGPT o3-mini2.2025 橫空出世嚇壞一堆先入者的 DeepSeek v3、

3.搜尋大神 Google 自家推出的 Gemini 2.5 Flash、

4.黃仁勳入股每天都在用的 Perplexity Sonar、

5.馬斯克打造的 Grok 3,以及

6.本和 ChatGPT 一家人但更追求道德理念的 Claude 3.7

事實上,大部分的時間我不會一直使用同一個,而是一個提問,同時丟給它們,再去比較哪個比較能解決我的問題。但是為了比較,本篇就拆開來比較,請大家參考他們的表現。以下,我就當作像找主管面試一樣,給予資格考和術科兩段考試,如下:

二、術科考試:圖文生成能力 - 擴寫新聞稿 X 文案生圖 X 社群貼文

去年大叔才針對五大GPT 優劣進行比較,才 2025 下半年,ai 發展神速,很多內容都已經不適用。於是這次再次針對 6 個免費 聊天機器人 進行比較。這次給 6 大免費聊天機器人的第一個任務,是透過一個主題,進行一連串的產出:

提供一個 word 文件(約500字,有不少艱澀的技術內文) 進行分析 用倒金字塔結構,採用比喻方式撰寫一篇具可讀性和引導性的新聞稿 透過所撰寫的新聞稿,直接出一張合適的照片 再透過新聞稿轉換 <創意社群貼文>以下是比較後,大叔給的成績:

(一) 擴寫倒金字塔新聞稿:Claude 結構和引導性強、Gemini 第二名

新聞稿倒金字塔結構就是透過第一段進行重點摘要後,段落放在後面越不重要。但如果能夠透過段落次標題,引導讀者一步一步有興趣的看完,才是最好的。Claude 就做到了這點,比喻的應用也十分到位,需要修正的幅度最小;Gemini 也表現不俗。

而 Grok 符合結構,該有的都有,但內容平平。Perplexity 竟然讀不出文件,還需要複製貼上才能改寫,雖比喻也到位,但少了很多原始文件中該保留的關鍵元素。

ChatGPT 很精簡的給了一篇稿,字數跟原來差不多,沒達到擴寫的任務;最後一名是根本沒有倒金字塔結構的 DeepSeek。

以下提供原始草稿,和Claude的產出連結,共大家下載看看。

原始 500 字草稿

Claude 3.7的產出

(二)長文產圖:Grok3 最猛,一次兩張還能改變情境;Claude 第二名

在不考慮真實產品與技術場景下,單純就長文產圖,Grok3 產圖速度最快,且提供的兩張圖都可以直接使用。 而 Claude 也產出一張頗有意思的圖。

其餘 Gemini、Perplexity、DeepSeek都無法產出;其中 ChatGPT 只回了很多人正在使用產圖功能,需要等待,結果等了一小時也沒產出。

(三) 改寫社群貼文: 這回 DeepSeek 第一名

社群平台貼文要求和風格都不一樣,但 DeepSeek 是唯一說明自己產出的貼文是給 Facebook或是 Linkedin使用,而且產出架構從標題、引導、數據比喻、Hushtag,都能用精簡且清楚段落呈現。Gemini 的產文邏輯跟 DeepSeek在這回有點像,但數據比喻上沒表現出來,給了第二名。

Claude 得到第三,其餘產文如果單就文案來看,不是吸睛度不夠,就是講不出特色重點。例如 ChatGPT 就感受不到誠意。

三、資格考:七個基礎功能與效果

所謂資格考是只以下的功能,幾乎都是三不五時可能會用到的基礎功能,但是每一個表現的效果也都不盡相同 :

(一) 聯網搜尋:大家都有,Perplixity 分的最細

聯網功能一開始只有 Perplexity,後來 DeepSeek 開源且聯網後,其他大語言模型都跟進了。不過,搜尋結果會提供資料來源目前是 Perplexity 和 Gemini。其中 Perplexity 還能夠做到搜尋設定,除了整個互聯網的搜尋外,也能針對學術、社群媒體或財經等特定網域進行搜索。

(二) 手寫文字辨識效果 (OCR):手寫字太醜?DeepSeek 和 Gemini 是認字高手

這裡大叔丟了一張道教相關的中文手寫筆記,由於字太醜有些連我都要猜一下。但這次中國開發的 DeepSeek 高達 95% 的辨別成功 (因為最懂中文?),而 Gemini 也高達 85% 辨識成功外,還幫忙整理出表格。

Perplexity正確率 30%、Claude 正確率 10%,而 Grok3 亂翻一通 0 分。ChapGPT 根本翻不出來,直接當機。

(三) 圖表生成:Claude 最有誠意

丟了一個張營業額彙總表的 pdf 檔,請它們利用 1-5月的營業總收入 與 淨利,繪出趨勢圖和長條圖。Claude 的圖最漂亮外,也是動態的,此外還很貼心的進行數據分析,說明圖表的意義。

Gemini 也產出了兩張圖,但精緻度與分析上並無Claude貼心。Grok 3只產出趨勢圖,但長條圖沒有提供。ChatGPT則一樣沒誠意的簡單產出一張趨勢圖,而且還出現亂碼。Perplexity和 DeepSeek 則無法產出圖。

(四)簡報生成:Gemini 的簡報產出,真香

目前很多人用ai做簡報,第一個絕對會想到GAMMA。然而這幾個免費聊天機器人,目前Gemini 2.5 pro就能幫你整理文件後,只要給予適當的提示詞,就能幫你做出網頁版的網站,你可以用這個網站再去GAMMA轉換為簡報。這裡提供網友實際操作的方法 (打造高質感AI簡報,第三招保證嚇到你!用Gemini跟提示詞,沒學到會後悔.) 。

(五) 文字生成圖片生成:Grok 還是最猛

這個是給各LLM輸入提示詞:畫一隻穿著太空衣的貓,站在月球上。結果 Grok 寶座沒被搶走,一次提供兩張外,還有不同情境可變化選擇。其餘 Gemnini、DeepSeek、Perplexity的產出也都不俗,也都產出一種電影海報風格十足的照片。

Claude這次表現倒是挺意外的,竟然產出一個2D有點兒童插畫風的圖,跟長文產圖的風格相差甚遠。

免費的 ChatGPT 依舊沒誠意,等了一個小時還是使用繁忙,產不出圖。

(六) 文字生成影片:這種好康都是要付費的

看到網路上很多人可以用 ai 製作短影片,這項強大的功能其實已經有很多生成式ai能達到這項目的,像是Runing、Kling 等,都可以用文字產生影片。但這次的六個大語言模型只有 ChatGPT 的 SORA、Gemini 的 Veo2 和 Grok 的 Aurora,這三個的文字生成也都是可以電影等級的,但是這都必須是付費才享用的到的功能。

(七) 錄音檔轉文字:大家都沒有這種服務

目前會用到錄音轉文字檔的最多時機就是會議記錄,但目前這幾個都沒有這樣的功能。但 Google 的 Notebooklm 就有這樣的功能 。請見前一篇文章(AI 筆記工具新王者?Google NotebookLM 實測:5種打造你「第二大腦」的情境!)。

四、一張表總整理:免費版的 ChatGPT 最不好用,Gemini 最香,Claude 和 Grok都很棒

可能是剛好使用的時間或是測試的問題,這次很意外的免費版的 ChatGPT 最不好用,而 Gemini 無論是功能的完整性與效果,以及考題實測都有相當水準;其次 Claude 和 Grok 也都令人驚艷。大家可以直接用這張表進行閱讀,打星號的就是成績優異的項目 (手機瀏覽請轉橫幅):

ChatGPT 4.1

DeepSeek V3

★Gemini 2.5 Flash

★Perplexity

★Grok 3

★Claude 3.7

新聞稿(word檔)擴寫

比喻貼切,但精簡產出,沒達到括寫的效果

毫無新聞稿架構可言

結構完整,比喻得體,閱讀性強

(讀不出原稿;改由貼文後產出) 比喻得體,但引導性平凡,且有些關鍵概念和案例被刪除

符合結構,但四平八穩

★引導性最強

(標題和比喻得體且吸睛)

依據內文直接產圖

V(產出速度慢)

★V

(一次兩張,還能更換場景)

V

縮文改寫社群貼文

兩句話解決,但不吸睛

★採用短語多,且有條列加上比喻。

★結構不錯,適合Line和FB貼文

段落文字太長

沒感覺

還行

讀取文件

(照片、word、pdf等)

V

( ChatGPT、Gemini和Grok可包含讀取google雲端/Microsoft OneDrive)

產出資料來源說明

★V

★V

互動式工作區

V (Canvas)

V ( Canvas )

V

圖片生成

(畫一隻穿著太空衣的貓,站在月球上)

V

V

V

V

V

V

影片生成

SORA (須付費)

Veo2 (須付費)

Aurora (須付費)

簡報生成

V (網頁)

音訊檔(如會議記錄)轉文字

都無法

圖表生成

V (平淡產出,還出現亂碼)

V(平淡產出)

V

★V (動態圖形提供重點分析)

OCR手寫文字辨識功能(道教相關筆記)

根本翻不出來

★懂中文,90%都對

★85% 都對,表格也出來了(但有些我自己都看不懂的字,錯了值得原諒)

對30%

亂翻 0分

只對10%

★聯網

V

V (可選擇一般網站、學術網站和社群平台)

V

缺點

免費版本不友善,速度慢、產文雖然精準,但感受不太到誠意(有問有達,但不會提供更驚豔的服務)

剛推出來時覺得很好用,但現在要看情況

五、5 個你可能很意外的實測心得

1. 聰明的人,不會只用一個聊天機器人

Ai 工具就是我們的顧問,相信如果你有很多顧問可以諮商,你總會不只聽一個人的意見吧?當然多聽幾個人的意見絕對是好的。所以,既然有了一個疑問或想解決的問題,就一次丟出你的提示詞,讓大家來幫你完成你的任務,你就只要去判斷,哪一個最能幫你解決問題。

又或是你蒐集所有 ai 的回覆後,你再請 ai 將這些訊息,再次統整彙整成一份,你有可以得到一份更周延的版本。

2. 最被低估的聊天機器人:Claude

身邊很多人都已經開始用聊天機器人,甚至很多也開始付費使用。但很少聽過有人用 Claude 的,但大叔常常在寫稿時,無論是 ai 創作、改寫、擴寫或社群貼文,Claude 總是很大比例,成為我最後選擇拿來做為我撰文的基礎架構和創意發想的文章。

3. 如果只能選一個,付費來增強功能,大叔此時選擇 Gemini

如果你有很喜歡的聊天機器人,當然你就去付費使用最完善的功能。如果是我要選擇,我會選擇Gemini,主要是:

(1)像是我本身就是 Google workspace 付費會員,有著雲端硬碟存檔、文檔、表單、Gmail等,你就可以直接升級,Gemini 就會影藏在這些功能中,隨時提供你協助,這真的是很棒的服務。

(2)還能搭配 2025 推出的 Google AI studio功能,可以辨識影音和音訊的多模態分析(可以是檔案、可以是連結),並幫你輸出逐字稿 (多人對話也能分辨得很清楚),或是進行摘要。

(3)可搭配使用升級版的 NoteBookLM,而motebooklm能幹嘛,請見前一篇文章(AI 筆記工具新王者?Google NotebookLM 實測:5種打造你「第二大腦」的情境!)。

4. 十分推薦付費版外掛 App : Monica 和 sider

但如果你很難抉擇,跟一般聊天機器人價格差不多、外掛的Monica 和 Sider 就可以考慮,主要原因有二:

(1) 同一個視窗就能同時使用所有最高階的聊天機器人

如果你覺得要問一個問題,必須一直切換視窗問不同的聊天機器人很麻煩,這時外掛app 就能同一視窗,幫你解決,無須切換畫面,這真的是便利很多。

(2) 功能用好用滿

其中這兩個要選一個的話,大叔是推薦 Monica,主要就是它的功能非常齊全,所有的功能在介面呈現的也非常清楚。像是圖片和影音生成,它所串接的Gen AI就非常多,意思是生成圖片和影音,你也可以問一問題,得到最豐沛的照片和影音產出。另外,它還有設計

5. 可能半年後結果又不一樣

AI 工具變化十分快速,而且整合度也越來越強,去年2024大叔才寫過一篇 <不想動腦? 2024 五大聊天機器人GPT:選哪個當你的第二大腦 >,當時 DeepSeek 和 Grok 都還沒出來。

沒想到隔一年,除了這些新銳工具的橫空出世帶來的驚喜外,大家也都慢慢習慣開始把 AI 工具當作生活的一部分。很多排名也可能頂多半年的時間,又會變得不一樣了。

所以明年再來檢視這篇文章,看看變化又會有多大。