Voice.ai با نزدیک شدن به 500 هزار کاربر، 6 میلیون دلار جمع آوری می کند
به گزارش سایت نود و هشت زوم Voice.ai با نزدیک شدن به 500 هزار کاربر، 6 میلیون دلار جمع آوری می کند
که در این بخش به محتوای این خبر با شما کاربران گرامی خواهیم پرداخت
سرویسهایی مانند Midjourney و ChatGPT مرزهای این که چگونه هوش مصنوعی میتواند تصاویر و متن را خارج از اعلانهای متنی اولیه ایجاد کند، افزایش دادهاند. اکنون، صدا به نظر می رسد که مرز اجتناب ناپذیر بعدی باشد. تولید موسیقی بر اساس پیامهای کلمه، مربیان هوش مصنوعی برای یادگیری زبان و شبیهسازهای صدا، همگی در ماههای اخیر شاهد پیشرفتهایی بودهاند. Voice.ai امیدوار است که بخشی از آن مکالمه (هه) با فناوری باشد که به کاربران اجازه می دهد صدای خود را در زمان واقعی تغییر دهند (و پنهان کنند)، و اکنون اولین بودجه خارجی خود را در پاشنه رشد اولیه جمع آوری کرده است.
Voice.ai با بیش از 480000 کاربر و کتابخانه ای با بیش از 50000 فیلتر صوتی، 6 میلیون دلار جمع آوری کرده است که قصد دارد از آن برای انتقال فناوری تغییر صدای خود به مکان های جدید استفاده کند.
Mucker Capital و M13 در این دور پیشتاز هستند. پیش از این، Voice.ai شفاهی رشد کرده است – این استارتاپ یک کانال Discord با بیش از 120000 نفر دارد – در پشتوانه 3 میلیون دلاری خود سرمایه گذاری.
در حال حاضر ابزارهای این شرکت – در دسترس به عنوان برنامه برای Mac، PC، Android و iOS – توسط گیمرها، سازندگان محتوا، Vtubers و دیگران در TikTok، Zoom، Discord، Minecraft، GTA5، Fortnite، Valorant، League of Legends، Among Us استفاده میشوند. ، اسکایپ، واتساپ و سایر سیستم عامل ها. رابط Voice.ai به آنها اجازه میدهد صدای جدیدی ایجاد کنند، یا از میان 50000 صدای از پیش ساخته شده مختلف (که توسط کاربرانی مانند خودشان ایجاد شده و به اشتراک گذاشته شدهاند) را انتخاب کنند، که میتواند آنطور که هست یا اصلاح شود، برای استفاده زنده در پلتفرمهای پشتیبانیشده، یا برای ضبط
این طرح استفاده از بودجه برای استخدام استعدادهای فنی بیشتر و ساخت SDK و APIهای جدید برای کار با پلتفرم های بیشتری مانند Meta، Unreal و Unity است. پشتیبانی چند زبانه را فراهم کنید. و برنامه های کاربردی جدیدی مانند آواز خواندن را که صدا در مرکز قرار دارد اضافه کنید.
این استارت آپ آن را مشخص نمی کند، اما جالب است که ببینیم آیا از بخشی از بودجه نیز برای افزایش ظرفیت سرور استفاده می کند.
این بار کمی نیست. به طور حکایتی، شنیدهایم که درد GPU یکی از بزرگترین فاکتورهای راهاندازی در نحوه مقیاسپذیری بسیاری از برنامههای هوش مصنوعی در حال حاضر است. (تا حدی به همین دلیل است که می بینید معاملات بزرگی انجام می شود که شامل استراتژی های ارائه پردازش و ظرفیت سرور می شود.)
مخصوصاً برای Voice.ai، صدای شما به صورت محلی پردازش میشود و از طریق آنچه که موسس و مدیر عامل هیث آرنز برای من به عنوان «کابل صوتی مجازی» توصیف میکند، به هر جایی که استفاده میشود هدایت میشود. اما وقتی به بررسی برنامههای آن نگاه میکنید، یک تاسف رایج این است که وقتی ثبتنام میکنید در لیست انتظار قرار میگیرید زیرا «تقاضای فوقالعاده سرورهای ما را حداکثر ظرفیت دارند» با این وعده که وقتی سرویس افزایش یافت به شما اطلاع داده میشود که ظرفیت.
امروزه ده ها سرویس گفتار به گفتار و صدا به گفتار در بازار وجود دارد، و در حال حاضر فعالیت زیادی در میان آنها وجود دارد: سال گذشته Spotify Sonantic را خریداری کرد و اسنپ حتی زودتر از آن دستیار صوتی هوش مصنوعی خریداری کرد. یکی دیگر از استارتآپهای Sanas روی تغییر لهجه شما کار میکند و شبیهسازهای صوتی Murf و Acapela در میان بسیاری دیگر وجود دارند. Voice.ai خود را در دسته بندی کلی Respeecher و ElevenLabs قرار می دهد، دو استارت آپ صدا به صدا AI، که به کاربران اجازه می دهد ماسک هایی را اعمال کنند تا صدای خود را تغییر دهند یا به طور کامل تغییر دهند – در برخی موارد صداهای کاملا مصنوعی را به جای صدای واقعی ایجاد می کنند.
Respeecher که در اوکراین تأسیس و مستقر است، با کمک به ساخت صدای جدید دارث ویدر برای قسمتهای جدید جنگ ستارگان، بر اساس صدای جیمز ارل جونز در 45 سال پیش که نقش را آغاز کرد، نامی برای خود دست و پا کرد. (با توجه به شخصیتی که مشتاق نابود کردن دنیاها بود، صدای دارث از دفاترش در اوکراین به مشتری هالیوودی تحویل داده شد که روسیه وارد کشور شد.)
ElevenLabs – معروف (یا بدنام در صورت ممکن) – پلتفرمی ساخته است که به طرز وحشتناکی در شبیه سازی صداها خوب است و اوایل این ماه آخرین دور سرمایه گذاری خود را به مبلغ 19 میلیون دلار از گروهی از سرمایه گذاران بزرگ دریافت کرد.
Voice.ai در این ترکیب تلاش می کند تا خود را به عنوان برنامه اصلاح کننده صدای هوش مصنوعی برای Everyman قرار دهد.
آرنز در ایمیلی به TechCrunch گفت: «شرکتهای زیادی وجود دارند که سعی میکنند طعم متفاوتی از فناوری صوتی را به مشاغل ارائه دهند.» Ahrens تجربه ای در ساخت فناوری هوش مصنوعی B2B دارد: دو شرکت قبلی او m-iSpeech برای تبدیل متن به گفتار و Haystack برای تشخیص چهره- بر اساس پیشنهادات API ساخته شده اند.
چیزی که Voice.ai را متمایز میکند این است که ما بر روی آوردن فناوریهایی که قبلاً برای شرکتهای سازمانی محفوظ بود، مستقیماً به روشی مقرونبهصرفه به دست مصرفکنندگان متمرکز شدهایم.» او خاطرنشان کرد: بسیاری از کاربران از تعویضکنندههای صدای DSP کلاسیک و تعدیلکنندههای صوتی که در گذشته از آنها استفاده میکردند و هنوز در میان بسیاری از گیمرها و استریمرها محبوب هستند، به ما مراجعه میکنند.
«مقرون به صرفه» در دو سطح ارائه میشود، اکثر کاربران اکنون از یک سرویس رایگان استفاده میکنند که از آنها میخواهد برای آموزش مدلهای Voice.ai قدرت محاسباتی را انتخاب کنند، با این سرویس که بر اساس مجموعه دادههای خصوصی خودش متشکل از «میلیونها نمونه منحصربهفرد» ساخته شده است. کاربران». هیچ قیمتی در سایت ارائه نشده است: ما این جزئیات را میپرسیم.
آرنس افزود: «ما معتقدیم فناوری را در دسترس قرار می دهیم و برای همکاری با جامعه منبع باز برنامه ریزی می کنیم تا فناوری هوش مصنوعی صوتی را دموکراتیک کنیم.
Voice.ai همچنین ادعا میکند که رویکردی اساساً متفاوت را برای چالش تغییر صدا اتخاذ میکند، و به برخی از اخلاقیاتی که در مورد استفاده از آواتارها توسط Vtubers، گیمرها و دیگران به صورت آنلاین ایجاد شده است، ضربه میزند.
آرنز گفت: «بیشتر شرکتهای هوش مصنوعی صوتی که وارد فضا میشوند، سعی میکنند راهحلهای مقیاسپذیر مبتنی بر متن به گفتار یا خدمات گران قیمت صدا به صدا را برای استودیوهای تولید بسازند. ما از طیف مخالف شروع می کنیم و سعی می کنیم برای افرادی که به دنبال گسترش صدای آنلاین خود هستند، ارزش ارائه دهیم. گزاره ارزش اصلی هوش مصنوعی گفتار به گفتار ما این نیست که بتواند به طور کامل هر فرد خاصی را تکرار کند. این است که عناصر اصلی گفتار کاربر را حفظ می کند: احساسات، سرعت و تاکید آنها در حین جایگزینی صدای صدا، به منظور ایجاد یک نتیجه نهایی کاملاً منحصر به فرد جدید، در زمان واقعی.
ممکن است به این دلیل باشد که جمعیتشناسی در پلتفرمهای تعاملی مانند بازیها دچار انحراف میشود، اما در حال حاضر مخاطبان Voice.ai 70 درصد مرد هستند در مقابل 30 درصد زن، با دستههای جدیدی که نه فقط درباره افرادی که از این فناوری استفاده میکنند، بلکه چرایی باز میشوند.
این نه تنها شامل کسانی میشود که از آواتارها استفاده میکنند و صداهایی را برای تطبیق با آنها میسازند، یا کسانی که به دنبال محافظت بیشتر از حریم خصوصی هستند، بلکه همچنین، به گفته او، «کاربران تراجنسیتی که میتوانند خود را با صداهایی مطابق با هویت خود نشان دهند، و همچنین کاربرانی که کاملاً جدید آنلاین را بررسی میکنند، میشود. شخصیت هایی برای خودشان.»
در حال حاضر پایگاهی از کاربران وجود دارد که از پیشنهادات مستقیم Voice.ai به مشتریان استفاده می کنند، اما یکی از دلایلی که Mucker در این استارتاپ سرمایه گذاری می کند این است که معتقد است فرصتی برای ایجاد شبکه ای از توسعه دهندگان با استفاده و ادغام وجود دارد. فن آوری آن
عمر هامویی، یکی از شرکای سرمایه گذار اصلی Mucker Capital می گوید: «Voice.ai آماده است تا جامعه توسعه دهندگان هوش مصنوعی را به شیوه ای شبیه به تأثیر AdMob بر جامعه توسعه دهندگان برنامه های تلفن همراه متحول کند. (هامویی قبلاً استارتاپ تبلیغات موبایلی Admob را تأسیس کرد که در نهایت توسط گوگل خریداری شد، بنابراین او تجربه مستقیمی در ساخت ابزارهای توسعهدهنده تلفن همراه دارد.) «با ارائه راهحلهای کاربرپسند که زمانی منحصر به شرکتهای بزرگ بود، Voice.ai قصد دارد تا دسترسی را دموکراتیک کند. توسعه دهندگان در سراسر جهان.”
کارل آلومار، مدیر اجرایی سابق Digital Ocean، که سرمایه گذاری برای M13 را رهبری کرد، گفت که سرمایه گذاران نقش فعالی در مرحله بعدی توسعه خواهند داشت. او گفت: «در Digital Ocean نیز ارزش ایجاد جامعه سازندگان توسط سازندگان را دیدیم. “ما برای سازندگان و توسعه دهندگان برای ساخت بر روی پلت فرم Voice.ai هیجان زده هستیم.”
امیدواریم از این مقاله مجله نود و هشت زوم نیز استفاده لازم را کرده باشید و در صورت تمایل آنرا با دوستان خود به اشتراک بگذارید و با امتیاز از قسمت پایین و درج نظرات باعث دلگرمی مجموعه مجله 98zoom باشید
لینک کوتاه مقاله : https://5ia.ir/NBr
کوتاه کننده لینک
کد QR :
آخرین دیدگاهها