AITranslations

ترجمه زنده با هوش مصنوعی برای گوش دادن چندزبانه.

AITranslations یک پروژه خصوصی برای ترجمه مبتنی بر هوش مصنوعی در نزدیکِ زمان واقعی است. این یک پیشنهاد تجاری نیست. هدف این است که افراد بتوانند یک رویداد را به زبان‌های مختلف دنبال کنند — با کیفیت بالا، گزینه‌های اختیاری حریم خصوصی، و هزینه‌های جاری قابل‌کنترل.

دسترسی و اتاق‌ها

همه چیز داخل یک «اتاق» اتفاق می‌افتد. اتاق، زمینه مشترک یک رویداد است: صدا به اتاق ارسال می‌شود و شنوندگان ترجمه را به زبان خود دریافت می‌کنند.

اتاق‌ها می‌توانند عمومی یا با رمز محافظت شوند. دسترسی فرستنده (ارسال صدا/ویدئو و مدیریت تنظیمات) فقط برای کاربران مجاز است. استفاده فقط با دعوت یا درخواست امکان‌پذیر است.

شفافیت هزینه (کلید API خودتان را بیاورید)

AITranslations از رویکرد «کلید API خودتان را بیاورید» پیروی می‌کند: پلتفرم به حساب‌های خودتان در ارائه‌دهندگان هوش مصنوعی متصل می‌شود. این کار انتخاب ارائه‌دهنده و صورتحساب را تحت کنترل شما نگه می‌دارد.

هزینه‌های جاری عمدتاً به حالت انتخابی، مدل، و تعداد زبان‌های مقصد بستگی دارد — و می‌توان آن‌ها را آگاهانه مدیریت کرد.

ماژولار بودن و حریم خصوصی

این پلتفرم ماژولار است. بسته به نیاز، می‌توانید از مدل‌های سطح بالا برای بیشترین وضوح استفاده کنید یا تنظیماتی را انتخاب کنید که حریم خصوصی قوی‌تری هدف بگیرند (برای مثال ارائه‌دهندگان جایگزین یا مدل‌های قابل میزبانی شخصی).

بسته به پیکربندی، صدا و/یا متن برای پردازش به ارائه‌دهندگان خارجی هوش مصنوعی ارسال می‌شود. ردیابی تبلیغاتی وجود ندارد؛ سنجه‌های عملیاتی ممکن است برای قابل‌اعتماد نگه‌داشتن سرویس استفاده شوند.

سه راه برای ترجمه زنده

AITranslations می‌تواند گفتار را به سه روش پردازش کند. تفاوت این روش‌ها در این است که صدای ترجمه‌شده مستقیماً تولید می‌شود یا ابتدا متن ساخته می‌شود.

1) ترجمه مستقیم گفتار به گفتار (Speech-to-Speech, S2S)

یک مدل بلادرنگ گفتار را مستقیماً به گفتار ترجمه‌شده تبدیل می‌کند. این رویکرد برای پخش طبیعی و تأخیر کم طراحی شده است.

2) ترجمه گفتار با خروجی صوتی پس از آن (AST→TTS)

گفتار ابتدا به متن ترجمه‌شده در زبان مقصد تبدیل می‌شود. سپس یک مدل text-to-speech (TTS) از آن خروجی گفتاری تولید می‌کند.

3) پردازش مبتنی بر رونوشت (STT/ASR → ترجمه → TTS)

گفتار ابتدا رونویسی می‌شود. سپس رونوشت ترجمه می‌شود و یک مدل text-to-speech (TTS) آن را به صوت تبدیل می‌کند.

کیفیت در استفاده زنده

AITranslations زمانی بهترین عملکرد را دارد که سیگنال ورودی واضح باشد: میکروفون خوب، نزدیکی کافی به گوینده و محیط آرام به‌طور محسوسی وضوح و کیفیت ترجمه را بهبود می‌دهد.

نقش‌ها: شنوندگان و فرستنده

شنوندگان می‌توانند با لینک یا QR به اتاق بپیوندند (و در صورت نیاز رمز را وارد کنند). نقش فرستنده برای ارسال صدا و مدیریت تنظیمات اتاق نیازمند مجوز است.

در حال توسعه

AITranslations هنوز در حال توسعه فعال است. برخی ویژگی‌ها ممکن است ناقص باشند، بدون اطلاع تغییر کنند، یا هنوز در همه تنظیمات به‌درستی کار نکنند.