Voice.ai با نزدیک شدن به 500 هزار کاربر، 6 میلیون دلار جمع آوری می کند

زمان مطالعه: 6 دقیقه

به گزارش سایت نود و هشت زوم Voice.ai با نزدیک شدن به 500 هزار کاربر، 6 میلیون دلار جمع آوری می کند
که در این بخش به محتوای این خبر با شما کاربران گرامی خواهیم پرداخت

سرویس‌هایی مانند Midjourney و ChatGPT مرزهای این که چگونه هوش مصنوعی می‌تواند تصاویر و متن را خارج از اعلان‌های متنی اولیه ایجاد کند، افزایش داده‌اند. اکنون، صدا به نظر می رسد که مرز اجتناب ناپذیر بعدی باشد. تولید موسیقی بر اساس پیام‌های کلمه، مربیان هوش مصنوعی برای یادگیری زبان و شبیه‌سازهای صدا، همگی در ماه‌های اخیر شاهد پیشرفت‌هایی بوده‌اند. Voice.ai امیدوار است که بخشی از آن مکالمه (هه) با فناوری باشد که به کاربران اجازه می دهد صدای خود را در زمان واقعی تغییر دهند (و پنهان کنند)، و اکنون اولین بودجه خارجی خود را در پاشنه رشد اولیه جمع آوری کرده است.

Voice.ai با بیش از 480000 کاربر و کتابخانه ای با بیش از 50000 فیلتر صوتی، 6 میلیون دلار جمع آوری کرده است که قصد دارد از آن برای انتقال فناوری تغییر صدای خود به مکان های جدید استفاده کند.

Mucker Capital و M13 در این دور پیشتاز هستند. پیش از این، Voice.ai شفاهی رشد کرده است – این استارتاپ یک کانال Discord با بیش از 120000 نفر دارد – در پشتوانه 3 میلیون دلاری خود سرمایه گذاری.

در حال حاضر ابزارهای این شرکت – در دسترس به عنوان برنامه برای Mac، PC، و iOS – توسط گیمرها، سازندگان محتوا، Vtubers و دیگران در TikTok، Zoom، Discord، Minecraft، GTA5، Fortnite، Valorant، League of Legends، Among Us استفاده می‌شوند. ، اسکایپ، واتساپ و سایر سیستم عامل ها. رابط Voice.ai به آن‌ها اجازه می‌دهد صدای جدیدی ایجاد کنند، یا از میان 50000 صدای از پیش ساخته شده مختلف (که توسط کاربرانی مانند خودشان ایجاد شده و به اشتراک گذاشته شده‌اند) را انتخاب کنند، که می‌تواند آن‌طور که هست یا اصلاح شود، برای استفاده زنده در پلتفرم‌های پشتیبانی‌شده، یا برای ضبط

این طرح استفاده از بودجه برای استخدام استعدادهای فنی بیشتر و ساخت SDK و APIهای جدید برای کار با پلتفرم های بیشتری مانند Meta، Unreal و Unity است. پشتیبانی چند زبانه را فراهم کنید. و برنامه های کاربردی جدیدی مانند آواز خواندن را که صدا در مرکز قرار دارد اضافه کنید.

این استارت آپ آن را مشخص نمی کند، اما جالب است که ببینیم آیا از بخشی از بودجه نیز برای افزایش ظرفیت سرور استفاده می کند.

این بار کمی نیست. به طور حکایتی، شنیده‌ایم که درد GPU یکی از بزرگ‌ترین فاکتورهای راه‌اندازی در نحوه مقیاس‌پذیری بسیاری از برنامه‌های هوش مصنوعی در حال حاضر است. (تا حدی به همین دلیل است که می بینید معاملات بزرگی انجام می شود که شامل استراتژی های ارائه پردازش و ظرفیت سرور می شود.)

مخصوصاً برای Voice.ai، صدای شما به صورت محلی پردازش می‌شود و از طریق آنچه که موسس و مدیر عامل هیث آرنز برای من به عنوان «کابل صوتی مجازی» توصیف می‌کند، به هر جایی که استفاده می‌شود هدایت می‌شود. اما وقتی به بررسی برنامه‌های آن نگاه می‌کنید، یک تاسف رایج این است که وقتی ثبت‌نام می‌کنید در لیست انتظار قرار می‌گیرید زیرا «تقاضای فوق‌العاده سرورهای ما را حداکثر ظرفیت دارند» با این وعده که وقتی سرویس افزایش یافت به شما اطلاع داده می‌شود که ظرفیت.

شاید این مقاله را هم دوست داشته باشید :  Quordle today - نکات و پاسخ‌ها برای دوشنبه، 17 ژوئیه (بازی شماره 539)

امروزه ده ها سرویس گفتار به گفتار و صدا به گفتار در بازار وجود دارد، و در حال حاضر فعالیت زیادی در میان آنها وجود دارد: سال گذشته Spotify Sonantic را خریداری کرد و اسنپ حتی زودتر از آن دستیار صوتی هوش مصنوعی خریداری کرد. یکی دیگر از استارت‌آپ‌های Sanas روی تغییر لهجه شما کار می‌کند و شبیه‌سازهای صوتی Murf و Acapela در میان بسیاری دیگر وجود دارند. Voice.ai خود را در دسته بندی کلی Respeecher و ElevenLabs قرار می دهد، دو استارت آپ صدا به صدا AI، که به کاربران اجازه می دهد ماسک هایی را اعمال کنند تا صدای خود را تغییر دهند یا به طور کامل تغییر دهند – در برخی موارد صداهای کاملا مصنوعی را به جای صدای واقعی ایجاد می کنند.

Respeecher که در اوکراین تأسیس و مستقر است، با کمک به ساخت صدای جدید دارث ویدر برای قسمت‌های جدید جنگ ستارگان، بر اساس صدای جیمز ارل جونز در 45 سال پیش که نقش را آغاز کرد، نامی برای خود دست و پا کرد. (با توجه به شخصیتی که مشتاق نابود کردن دنیاها بود، صدای دارث از دفاترش در اوکراین به مشتری هالیوودی تحویل داده شد که روسیه وارد کشور شد.)

ElevenLabs – معروف (یا بدنام در صورت ممکن) – پلتفرمی ساخته است که به طرز وحشتناکی در شبیه سازی صداها خوب است و اوایل این ماه آخرین دور سرمایه گذاری خود را به مبلغ 19 میلیون دلار از گروهی از سرمایه گذاران بزرگ دریافت کرد.

Voice.ai در این ترکیب تلاش می کند تا خود را به عنوان برنامه اصلاح کننده صدای هوش مصنوعی برای Everyman قرار دهد.

آرنز در ایمیلی به TechCrunch گفت: «شرکت‌های زیادی وجود دارند که سعی می‌کنند طعم متفاوتی از فناوری صوتی را به مشاغل ارائه دهند.» Ahrens تجربه ای در ساخت فناوری هوش مصنوعی B2B دارد: دو شرکت قبلی او m-iSpeech برای تبدیل متن به گفتار و Haystack برای تشخیص چهره- بر اساس پیشنهادات API ساخته شده اند.

چیزی که Voice.ai را متمایز می‌کند این است که ما بر روی آوردن فناوری‌هایی که قبلاً برای شرکت‌های سازمانی محفوظ بود، مستقیماً به روشی مقرون‌به‌صرفه به دست مصرف‌کنندگان متمرکز شده‌ایم.» او خاطرنشان کرد: بسیاری از کاربران از تعویض‌کننده‌های صدای DSP کلاسیک و تعدیل‌کننده‌های صوتی که در گذشته از آن‌ها استفاده می‌کردند و هنوز در میان بسیاری از گیمرها و رها محبوب هستند، به ما مراجعه می‌کنند.

«مقرون به صرفه» در دو سطح ارائه می‌شود، اکثر کاربران اکنون از یک سرویس رایگان استفاده می‌کنند که از آن‌ها می‌خواهد برای آموزش مدل‌های Voice.ai قدرت محاسباتی را انتخاب کنند، با این سرویس که بر اساس مجموعه داده‌های خصوصی خودش متشکل از «میلیون‌ها نمونه منحصربه‌فرد» ساخته شده است. کاربران». هیچ قیمتی در سایت ارائه نشده است: ما این جزئیات را می‌پرسیم.

آرنس افزود: «ما معتقدیم فناوری را در دسترس قرار می دهیم و برای همکاری با جامعه منبع باز برنامه ریزی می کنیم تا فناوری هوش مصنوعی صوتی را دموکراتیک کنیم.

Voice.ai همچنین ادعا می‌کند که رویکردی اساساً متفاوت را برای چالش تغییر صدا اتخاذ می‌کند، و به برخی از اخلاقیاتی که در مورد استفاده از آواتارها توسط Vtubers، گیمرها و دیگران به صورت آنلاین ایجاد شده است، ضربه می‌زند.

شاید این مقاله را هم دوست داشته باشید :  رفع موقت خطاهای پخش HBO Max در Apple TV 4K

آرنز گفت: «بیشتر شرکت‌های هوش مصنوعی صوتی که وارد فضا می‌شوند، سعی می‌کنند راه‌حل‌های مقیاس‌پذیر مبتنی بر متن به گفتار یا خدمات گران قیمت صدا به صدا را برای استودیوهای تولید بسازند. ما از طیف مخالف شروع می کنیم و سعی می کنیم برای افرادی که به دنبال گسترش صدای آنلاین خود هستند، ارزش ارائه دهیم. گزاره ارزش اصلی هوش مصنوعی گفتار به گفتار ما این نیست که بتواند به طور کامل هر فرد خاصی را تکرار کند. این است که عناصر اصلی گفتار کاربر را حفظ می کند: احساسات، سرعت و تاکید آنها در حین جایگزینی صدای صدا، به منظور ایجاد یک نتیجه نهایی کاملاً منحصر به فرد جدید، در زمان واقعی.

ممکن است به این دلیل باشد که جمعیت‌شناسی در پلت‌فرم‌های تعاملی مانند ‌ها دچار انحراف می‌شود، اما در حال حاضر مخاطبان Voice.ai 70 درصد مرد هستند در مقابل 30 درصد زن، با دسته‌های جدیدی که نه فقط درباره افرادی که از این فناوری استفاده می‌کنند، بلکه چرایی باز می‌شوند.

این نه تنها شامل کسانی می‌شود که از آواتارها استفاده می‌کنند و صداهایی را برای تطبیق با آنها می‌سازند، یا کسانی که به دنبال محافظت بیشتر از حریم خصوصی هستند، بلکه همچنین، به گفته او، «کاربران تراجنسیتی که می‌توانند خود را با صداهایی مطابق با هویت خود نشان دهند، و همچنین کاربرانی که کاملاً جدید آنلاین را بررسی می‌کنند، می‌شود. شخصیت هایی برای خودشان.»

در حال حاضر پایگاهی از کاربران وجود دارد که از پیشنهادات مستقیم Voice.ai به مشتریان استفاده می کنند، اما یکی از دلایلی که Mucker در این استارتاپ سرمایه گذاری می کند این است که معتقد است فرصتی برای ایجاد شبکه ای از توسعه دهندگان با استفاده و ادغام وجود دارد. فن آوری آن

عمر هامویی، یکی از شرکای سرمایه گذار اصلی Mucker Capital می گوید: «Voice.ai آماده است تا جامعه توسعه دهندگان هوش مصنوعی را به شیوه ای شبیه به تأثیر AdMob بر جامعه توسعه دهندگان برنامه های تلفن همراه متحول کند. (هامویی قبلاً استارتاپ تبلیغات موبایلی Admob را تأسیس کرد که در نهایت توسط گوگل خریداری شد، بنابراین او تجربه مستقیمی در ساخت ابزارهای توسعه‌دهنده تلفن همراه دارد.) «با ارائه راه‌حل‌های کاربرپسند که زمانی منحصر به شرکت‌های بزرگ بود، Voice.ai قصد دارد تا دسترسی را دموکراتیک کند. توسعه دهندگان در سراسر جهان.”

کارل آلومار، مدیر اجرایی سابق Digital Ocean، که سرمایه گذاری برای M13 را رهبری کرد، گفت که سرمایه گذاران نقش فعالی در مرحله بعدی توسعه خواهند داشت. او گفت: «در Digital Ocean نیز ارزش ایجاد جامعه سازندگان توسط سازندگان را دیدیم. “ما برای سازندگان و توسعه دهندگان برای ساخت بر روی پلت فرم Voice.ai هیجان زده هستیم.”

امیدواریم از این مقاله مجله نود و هشت زوم نیز استفاده لازم را کرده باشید و در صورت تمایل آنرا با دوستان خود به اشتراک بگذارید و با امتیاز از قسمت پایین و درج نظرات باعث دلگرمی مجموعه مجله 98zoom باشید

امتیاز بدهید

لینک کوتاه مقاله : https://5ia.ir/NBr
کوتاه کننده لینک
کد QR :
اشتراک گذاری
سروناز مقدم پور

سروناز مقدم پور

سروناز مقدم پور هستم کارشناس مهندسی کامپیوتر و مدیر وبسایت نود و هشت زوم. چندین سال است که در حوزه وب فعالیت می کنم و تخصص های اصلیم طراحی سایت و سئو است بعد از یادگیری علاقه زیادی به آموزش دادن دارم

شاید این مطالب را هم دوست داشته باشید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *