信頼性と評価

方法とベンチマーク

Zush が AI ファイル名の品質を評価する基準、検証手順、更新方針。

毎月レビュー 5つの加重チェック 公開 changelog
ガバナンス

編集責任

主担当

Zush 編集チーム

技術レビュー

Zush プロダクトチーム

更新頻度

基準は毎月確認し、重要な変更は changelog.

評価基準

スコアリング基準

各ワークフローは、名前の正確性、安全性、日常利用のしやすさを加重モデルで評価します。

項目重み測定内容
意味的なファイル名精度 35% 新しい名前が汎用パターンではなくファイルの意味を表すか。
バッチ内の一貫性 20% 混在ファイルでも命名スタイルが安定しているか。
自動化の深さ 15% バッチ、フォルダ監視、再現性。
安全制御 15% 履歴、元に戻す、適用前プレビュー。
運用適合性 15% macOS ワークフロー品質、速度、設定の手間。
検証

ベンチマーク手順

  1. 01

    スクリーンショット、写真、PDF、Office 文書を含む混在セットを使う。

  2. 02

    同じプロンプトと命名制約で制御されたリネームを実行する。

  3. 03

    結果を評価し、誤検出や曖昧な名前を記録する。

  4. 04

    本番利用前に復元と取り消し動作を確認する。

  5. 05

    リリース後に再検証し、重要な変更を記録する。