2024年2月20日
機能
VRChat OSC 連携機能の追加
- チャットバブル機能の実装
- VRChatのチャットバブルと連携し、音声認識テキストをゲーム内で表示できるようになりました。
- OSCサポートの追加
- VRChatとのOpen Sound Control (OSC)連携が可能になりました。
- サーバーポート設定が更新され、より柔軟な接続オプションを提供します。
- VRChat専用設定の追加
- 基本設定および詳細設定タブにVRChat固有のオプションを追加しました。
- サーバーホストとポートを自由に構成できるようになりました。
音声認識エンジンの改善
- Whisperモデルの最適化
- デフォルトモデルサイズを'base'から'small'に変更し、パフォーマンスと精度のバランスを改善。
- Faster Whisperモデル設定に
compute_type
サポートを追加し、様々なハードウェア構成での動作を最適化。
- オーディオ処理の強化
- 最大オーディオ履歴カットオフ秒数の設定を追加。古い音声データを参照しなくなりました。
- 音声データのロギング方法を変更し、指定秒数まで、音声データで履歴を残すことにより、文字起こし精度を改善
- オーディオ履歴管理と処理を強化し、長時間の音声認識でもメモリ使用量を抑制。
OBS字幕システムの最適化
- 字幕アニメーションの改善
- 字幕アニメーションを修正し、字幕が重なる問題を修正しました!
- HTML内部処理の修正
アプリケーション安定性の向上
- 起動とシャットダウンプロセスの強化
- アプリケーションの起動およびシャットダウンを強化し、堅牢なシグナル処理とエラーログを実装。
- スプラッシュスクリーンのサポートを追加し、初期化プロセスを視覚的に表示。
- サーバースレッド管理の改善
- asyncioイベントループを統合し、サーバースレッド管理を強化。
- WebTranscriberのシャットダウンプロセスを改善し、リソースリークを防止。
変更と修正
- ローカリゼーションの強化
- 改善された翻訳と言語サポートでローカリゼーションファイルを更新。
- Speech-to-Text (STT)リアルタイム文字起こし機能に多言語サポートを追加。
- ログシステムの改善
- 共通のログファイルを使用してロギング設定を一元化。
- アプリケーション設定から動的なログレベル設定を実装し、トラブルシューティングを容易に。
- ビルドプロセスの最適化
- ビルドスクリプトを更新し、モジュールとビルドオプションを最適化。
images
ディレクトリの参照を修正し、リソースの読み込みを改善。
- 無料版の調整
- 無料版タイマーの動作を改善し、文字起こしが停止した際にタイマーも停止するように修正。