برنامه نویسان پروتئین از هوش مصنوعی مولد کرادل کمک می گیرند •
پروتئینها مولکولهایی هستند که کار را در طبیعت انجام میدهند، و صنعت کاملی در حال ظهور است که با موفقیت آنها را برای مصارف مختلف تغییر داده و تولید میکند. اما انجام این کار زمان بر و اتفاقی است. Cradle قصد دارد با ابزاری مجهز به هوش مصنوعی که به دانشمندان میگوید چه ساختارها و توالیهای جدیدی یک پروتئین را وادار میکند آنچه را که میخواهند انجام دهد، تغییر دهد. این شرکت امروز از مخفی کاری بیرون آمد و با یک دور دانه قابل توجه ظاهر شد.
هوش مصنوعی و پروتئینها اخیراً در اخبار بودهاند، اما بیشتر به دلیل تلاشهای گروههای تحقیقاتی مانند DeepMind و Baker Lab. مدلهای یادگیری ماشینی آنها دادههای توالی RNA را که به راحتی جمعآوری میشوند، دریافت میکنند و ساختاری را که یک پروتئین برمیدارد، پیشبینی میکند – مرحلهای که هفتهها طول میکشید و تجهیزات ویژه گرانقیمت.
اما به همان اندازه که این قابلیت در برخی حوزه ها باورنکردنی است، برای برخی دیگر فقط نقطه شروع است. اصلاح یک پروتئین برای پایدارتر شدن یا اتصال به یک مولکول دیگر، بسیار بیشتر از درک شکل و اندازه کلی آن است.
“اگر شما یک مهندس پروتئین هستید و می خواهید ویژگی یا عملکرد خاصی را در یک پروتئین طراحی کنید، فقط دانستن اینکه چگونه به نظر می رسد کمکی به شما نمی کند. مثل این است که اگر تصویری از یک پل داشته باشید، به شما نمی گوید که سقوط می کند یا نه.
او ادامه داد: “آلفافولد دنباله ای می گیرد و پیش بینی می کند که پروتئین چگونه به نظر می رسد.” ما برادر مولد آن هستیم: شما ویژگیهایی را که میخواهید مهندسی کنید انتخاب میکنید و مدل توالیهایی را تولید میکند که میتوانید در آزمایشگاه خود آزمایش کنید.»
پیشبینی اینکه پروتئینها – بهویژه آنهایی که تازه وارد علم شدهاند – چه کاری انجام خواهند داد در موقعیت به دلایل زیادی کار دشواری است، اما در زمینه یادگیری ماشینی، بزرگترین مشکل این است که داده های کافی در دسترس نیست. بنابراین Cradle بسیاری از مجموعه داده های خود را در یک آزمایشگاه مرطوب ایجاد کرد، پروتئین را بعد از پروتئین آزمایش کرد و مشاهده کرد که به نظر می رسد چه تغییراتی در توالی آنها منجر به چه اثراتی می شود.
جالب است که خود این مدل دقیقاً مختص بیوتکنولوژی نیست، بلکه مشتق شده از همان “مدل های زبان بزرگ” است که موتورهای تولید متن مانند GPT-3 را تولید کرده اند. ون گریکن خاطرنشان کرد که این مدلها صرفاً به زبان در نحوه درک و پیشبینی دادهها محدود نمیشوند، یک ویژگی جالب «تعمیمسازی» که محققان هنوز در حال بررسی آن هستند.
توالیهای پروتئینی که کرادل میخورد و پیشبینی میکند، البته به هیچ زبانی که ما میشناسیم نیست، اما آنها دنبالههای خطی نسبتاً سادهای از متن هستند که معانی مرتبطی دارند. ون گریکن گفت: «این مانند یک زبان برنامه نویسی بیگانه است.
البته مهندسان پروتئین درمانده نیستند، اما کار آنها لزوماً شامل حدس زدن زیادی است. ممکن است نسبتاً مطمئن باشید که در بین 100 دنباله ای که آنها در حال تغییر هستند، ترکیبی است که اثر مورد نظر را ایجاد می کند، اما فراتر از آن، به آزمایش جامع ختم می شود. کمی اشاره در اینجا می تواند به طور قابل توجهی سرعت کار را افزایش دهد و از مقدار زیادی کار بی ثمر جلوگیری کند.
او توضیح داد که این مدل در سه لایه اساسی کار می کند. ابتدا ارزیابی می کند که آیا یک دنباله داده شده “طبیعی” است یا خیر. آیا این یک توالی معنی دار از اسیدهای آمینه یا فقط تصادفی است. این شبیه به یک مدل زبانی است که فقط میتوان با 99% اطمینان گفت که یک جمله به زبان انگلیسی (یا سوئدی، در مثال ون گریکن) است و کلمات در ترتیب صحیح هستند. این را از “خواندن” میلیون ها دنباله از این دست که توسط تجزیه و تحلیل آزمایشگاهی تعیین شده است، می داند.
سپس به معنای واقعی یا بالقوه در زبان بیگانه پروتئین می پردازد. او گفت: «تصور کنید ما یک سکانس به شما می دهیم، و این دمایی است که در آن این دنباله از هم می پاشد. “اگر این کار را برای تعداد زیادی دنباله انجام دهید، می توانید نه فقط بگویید “این طبیعی به نظر می رسد” بلکه “به نظر می رسد 26 درجه سانتیگراد.” این به مدل کمک می کند تا بفهمد روی چه مناطقی از پروتئین باید تمرکز کند.”
سپس این مدل میتواند توالیهایی را پیشنهاد کند که در آن جای بگیرند – حدسهای آموزشدیده، اساسا، اما نقطه شروع قویتر از ابتدا. سپس مهندس یا آزمایشگاه میتوانند آنها را امتحان کنند و آن دادهها را به پلتفرم Cradle برگردانند، جایی که میتوان آنها را دوباره مصرف کرد و برای تنظیم دقیق مدل برای موقعیت استفاده کرد.
اصلاح پروتئین ها برای اهداف مختلف در بیوتکنولوژی مفید است، از طراحی دارو تا تولید زیستی، و مسیر از مولکول وانیل به مولکول سفارشی، موثر و کارآمد می تواند طولانی و گران باشد. هر راهی برای کوتاه کردن آن احتمالاً حداقل مورد استقبال کارشناسان آزمایشگاهی قرار خواهد گرفت که باید صدها آزمایش را فقط برای رسیدن به یک نتیجه خوب انجام دهند.
Cradle در مخفی کاری فعالیت می کند و اکنون با جمع آوری 5.5 میلیون دلار در یک دور اولیه با همکاری Index Ventures و Kindred Capital با مشارکت فرشتگان John Zimmer، Feike Sijbesma و Emily Leproust در حال ظهور است.
ون گریکن گفت این بودجه به تیم این امکان را میدهد که جمعآوری دادهها را افزایش دهد – هر چه بیشتر در مورد یادگیری ماشینی بهتر باشد – و روی محصول کار کند تا آن را “سلف سرویس” بیشتر کند.
ون گریکن در بیانیه مطبوعاتی گفت: “هدف ما کاهش هزینه و زمان عرضه یک محصول مبتنی بر زیست به بازار است تا هر کسی – حتی “دو بچه در گاراژ خود” – بتواند به بازار بیاورد. محصولی مبتنی بر زیست به بازار».
لینک کوتاه مقاله : https://5ia.ir/VwJsop
کوتاه کننده لینک
کد QR :
آخرین دیدگاهها