資料格式轉換與 Token 分析器
在 JSON, YAML, TOML 與 TOON 格式間轉換,並即時計算 LLM Token 用量與節省效益。
關於資料格式轉換器
這是一個專為 LLM 提示工程與資料交換設計的工具。除了常見的 JSON/YAML/TOML 互轉,我們還引入了 TOON 格式,旨在不犧牲可讀性的前提下,大幅減少 Token 用量。
Token 計算原理
本工具使用 tiktoken 函式庫,並採用 cl100k_base 編碼模型進行計算。這是 OpenAI GPT-4, GPT-3.5-turbo, text-embedding-ada-002 等模型所使用的標準 Tokenizer,確保計算結果與實際 API 用量高度一致。
TOON 節省效益
對於重複性高的結構化資料(如物件陣列),JSON 因為重複 Key 名稱而浪費大量 Token。TOON 格式透過提取表頭與簡化符號,通常能節省 30% ~ 60% 的 Token 成本,讓您能在 Context Window 中放入更多資料。
壓縮模式
開啟「壓縮模式」後,工具會自動移除輸出的所有非必要空白與換行符號(針對 JSON 與 TOON 特別有效)。雖然這會降低人類可讀性,但對於 AI 模型來說,這是最極致的 Token 節省方案,適合用於 Context Window 非常緊繃的場景。
支援格式介紹
JSON (JavaScript Object Notation)
Web APIConfig 最通用的資料交換格式。相容性最高,但語法較為冗長(大量的引號與括號),Token 用量通常最高。
YAML (YAML Ain't Markup Language)
CI/CDKubernetes 以縮排呈現結構,可讀性極佳。比 JSON 精簡,適合設定檔。但在 LLM 中有時會因為縮排解析錯誤而產生幻覺。
TOML (Tom's Obvious, Minimal Language)
RustPython 類似 INI 檔案的格式,結構明確。對於扁平的設定檔非常精簡,但處理深層巢狀資料時可能會變得很長。
TOON (Token-Oriented Object Notation)
LLM OptimizationSince 2025本工具特製格式 (2025 年創造)。針對「物件陣列」優化,類似 CSV 但保留型別安全。透過 keys[...] 定義表頭,大幅移除重複的 Key,是給 AI 閱讀的最佳性價比選擇。
隱私與安全性聲明
您的資料安全是我們最重視的。本工具採用 Client-side Computing 技術,所有的運算過程都在您的裝置(手機或電腦)上即時執行。
這意味著:您輸入的任何內容都不會被上傳到網際網路或我們的伺服器。即使是機密文件、私人日記或程式碼,您都可以安心地在此貼上並進行處理。
