AI تولیدی: دنیای جدید خلاق

ساخت وبلاگ

یک کلاس جدید قدرتمند از مدل های بزرگ زبان این امکان را برای نوشتن ، کد ، ترسیم و ایجاد با نتایج معتبر و گاه فوق بشری فراهم می کند.

انسان در تجزیه و تحلیل چیزها خوب است. ماشین آلات حتی بهتر هستند. ماشین آلات می توانند مجموعه ای از داده ها را تجزیه و تحلیل کرده و الگوهای موجود در آن را برای بسیاری از موارد استفاده ، اعم از کلاهبرداری یا تشخیص هرزنامه ، یا پیش بینی ETA تحویل شما یا پیش بینی اینکه کدام ویدیوی Tiktok را برای شما نشان می دهد ، تجزیه و تحلیل کند. آنها در این کارها باهوش تر می شوند. به این "AI تحلیلی" یا AI سنتی گفته می شود.

اما انسان ها نه تنها در تجزیه و تحلیل چیزها خوب هستند بلکه ما در ایجاد نیز خوب هستیم. ما شعر می نویسیم ، محصولات طراحی می کنیم ، بازی می کنیم و کد را لنگ می زنیم. تا همین اواخر ، ماشین آلات هیچ فرصتی برای رقابت با انسان در کار خلاقانه نداشتند - آنها به تجزیه و تحلیل و کار شناختی منتقل شدند. اما ماشین ها تازه در ایجاد چیزهای معقول و زیبا شروع به کار می کنند. این دسته جدید "AI مولد" نامیده می شود ، به این معنی که دستگاه به جای تجزیه و تحلیل چیزی که از قبل وجود دارد ، چیز جدیدی ایجاد می کند.

هوش مصنوعی تولیدی در راه رسیدن به نه تنها سریعتر و ارزان تر بلکه در بعضی موارد بهتر از آنچه انسان ها با دست ایجاد می کنند بهتر است. هر صنعتی که انسان را به ایجاد کار اصلی نیاز دارد - از رسانه های اجتماعی گرفته تا بازی ، تبلیغات تا معماری ، برنامه نویسی به طراحی گرافیک ، طراحی محصول تا قانون ، بازاریابی تا فروش - برای نوآوری آماده است. برخی از کارکردها ممکن است کاملاً جایگزین AI تولید شوند ، در حالی که برخی دیگر از یک چرخه خلاقانه و تکراری محکم بین انسان و ماشین شکوفا می شوند - اما هوش مصنوعی تولیدی باید در طیف گسترده ای از بازارهای انتهایی ایجاد بهتر ، سریعتر و ارزان تر را باز کند. رویا این است که هوش مصنوعی تولیدی هزینه حاشیه ای ایجاد و دانش را به سمت صفر کاهش می دهد و باعث ایجاد بهره وری گسترده نیروی کار و ارزش اقتصادی و درپوش بازار متناسب می شود.

زمینه هایی که AI تولیدی می کنند - کار و کار خلاقانه - میلیارد ها کارگر را صلاحیت می دهند. هوش مصنوعی تولیدی می تواند این کارگران را حداقل 10 ٪ کارآمدتر و/یا خلاق تر کند: آنها نه تنها سریعتر و کارآمدتر می شوند ، بلکه از گذشته توانمندتر می شوند. بنابراین ، هوش مصنوعی مولد پتانسیل تولید تریلیون دلار ارزش اقتصادی را دارد.

چرا حالا؟

AI تولیدی همان "چرا اکنون" را به طور گسترده تر دارد: مدل های بهتر ، داده های بیشتر ، محاسبه تر. این گروه سریعتر از آنچه می توانیم ضبط کنیم در حال تغییر است ، اما ارزش آن را دارد که تاریخ اخیر را در سکته های گسترده بازگو کنید تا لحظه فعلی را در متن قرار دهیم.

موج 1: مدل های کوچک سلطنت Supreme (قبل از سال 2015) 5+ سال پیش ، مدل های کوچک "وضعیت هنر" برای درک زبان در نظر گرفته می شوند. این مدل های کوچک در کارهای تحلیلی برتری دارند و از پیش بینی زمان تحویل گرفته تا طبقه بندی کلاهبرداری برای مشاغل مستقر می شوند. با این حال ، آنها به اندازه کافی برای کارهای تولیدی با هدف کلی بیان نیستند. تولید نوشتن یا کد در سطح انسان یک رویای لوله است.

موج 2: The Race to Scale (2015-Today) یک مقاله برجسته توسط Google Research (توجه همه شما نیاز دارید) یک معماری جدید شبکه عصبی را برای درک زبان طبیعی به نام ترانسفورماتورها توصیف می کند که می تواند مدلهای زبان با کیفیت برتر را ایجاد کند در حالی که موازی تر و نیازمند استبه طور قابل توجهی زمان کمتری برای آموزش. این مدل ها یادگیرنده چند شات هستند و می توانند در حوزه های خاص نسبتاً آسان سفارشی شوند.

مطمئناً ، هرچه مدل ها بزرگتر و بزرگتر شوند ، آنها شروع به ارائه سطح انسانی و سپس نتایج فوق بشری می کنند. بین سالهای 2015 و 2020 ، محاسبات مورد استفاده برای آموزش این مدل ها با 6 مرتبه از بزرگی افزایش می یابد و نتایج آنها از معیارهای عملکرد انسانی در دست نویس ، تشخیص گفتار و تصویر ، درک مطلب خواندن و درک زبان فراتر می رود. GPT-3 Openai برجسته است: عملکرد مدل یک جهش غول پیکر نسبت به GPT-2 است و نمایش های توییتر توییتر را در وظایف تولید کد گرفته تا نوشتن شوخی Snarky ارائه می دهد.

با وجود همه پیشرفت های اساسی تحقیقات ، این مدل ها گسترده نیستند. اجرای آنها بزرگ و دشوار است (نیاز به ارکستراسیون GPU) ، به طور گسترده ای در دسترس نیست (فقط بتا در دسترس یا بسته) و برای استفاده به عنوان یک سرویس ابری گران است. با وجود این محدودیت ها ، اولین برنامه های تولید هوش مصنوعی شروع به ورود به سر و صدا می کنند.

موج 3: محاسبات بهتر ، سریعتر ، ارزانتر (2022+) ارزان تر می شود. تکنیک های جدید ، مانند مدل های انتشار ، هزینه های مورد نیاز برای آموزش و اجرای استنباط را کاهش می دهند. جامعه تحقیقاتی همچنان الگوریتم های بهتری و مدل های بزرگتر را توسعه می دهد. دسترسی به توسعه دهنده از بتا بسته برای باز کردن بتا یا در بعضی موارد منبع باز گسترش می یابد.

برای توسعه دهندگان که از دسترسی به LLMS گرسنه شده بودند ، اکنون سیلاب ها برای اکتشاف و توسعه برنامه باز هستند. برنامه ها شروع به شکوفا می کنند.

موج 4: برنامه های قاتل (اکنون) با جامد کردن لایه پلتفرم ظاهر می شوند ، مدل هایی که همچنان بهتر/سریعتر/ارزان تر می شوند ، و مدل دسترسی به مدل به منبع آزاد و باز ، لایه برنامه برای انفجار خلاقیت رسیده است.

درست همانطور که موبایل انواع جدیدی از برنامه ها را از طریق قابلیت های جدید مانند GPS ، دوربین ها و اتصال به صورت در حال انجام است ، انتظار داریم که این مدل های بزرگ موج جدیدی از برنامه های تولید AI را ایجاد کنند. و درست همانطور که نقطه تورم موبایل یک دهه پیش بازاری را برای تعداد انگشت شماری از برنامه های قاتل ایجاد کرد ، انتظار داریم برنامه های قاتل برای AI تولیدی ظاهر شوند. مسابقه روشن است.

چشم انداز بازار

در زیر یک طرحواره ای وجود دارد که لایه پلتفرم را توصیف می کند که هر دسته و انواع بالقوه برنامه هایی را که در بالا ساخته می شود ، قدرت می دهد.

مطمئناً ، هرچه مدل ها بزرگتر و بزرگتر شوند ، آنها شروع به ارائه سطح انسانی و سپس نتایج فوق بشری می کنند.

درست همانطور که موبایل انواع جدیدی از برنامه ها را از طریق قابلیت های جدید مانند GPS ، دوربین ها و اتصال به صورت در حال انجام است ، انتظار داریم که این مدل های بزرگ موج جدیدی از برنامه های تولید AI را ایجاد کنند.

مدل ها

  • متن پیشرفته ترین دامنه است. با این حال ، زبان طبیعی سخت است و به کیفیت و کیفیت اهمیت دارد. امروزه ، این مدل ها در نوشتن کوتاه و متوسط عمومی خوب هستند (اما با این وجود ، آنها معمولاً برای تکرار یا پیش نویس های اول استفاده می شوند). با گذشت زمان ، با بهتر شدن مدل ها ، باید انتظار داشته باشیم که شاهد خروجی های با کیفیت بالاتر ، محتوای طولانی تر و تنظیم عمودی بهتر باشیم.
  • تولید کد احتمالاً تأثیر زیادی در بهره وری توسعه دهنده در کوتاه مدت خواهد داشت ، همانطور که توسط GitHub Copilot نشان داده شده است. همچنین استفاده خلاقانه از کد را برای غیر توسعه دهندگان قابل دسترسی تر می کند.
  • تصاویر یک پدیده جدیدتر هستند ، اما ویروسی شده اند: به اشتراک گذاشتن تصاویر تولید شده در توییتر بسیار جالب تر از متن است! ما شاهد ظهور مدل های تصویر با سبک های زیبایی شناسی مختلف و تکنیک های مختلف برای ویرایش و اصلاح تصاویر تولید شده هستیم.
  • سنتز گفتار مدتی است (سلام سیری!) اما برنامه های مصرف کننده و سازمانی فقط خوب می شوند. برای برنامه های سطح بالا مانند فیلم و پادکست ها ، نوار برای گفتار با کیفیت انسانی با کیفیت انسانی که مکانیکی به نظر نمی رسد بسیار زیاد است. اما درست مانند تصاویر ، مدل های امروز نقطه شروع برای پالایش بیشتر یا خروجی نهایی برای برنامه های کاربردی را ارائه می دهند.
  • مدلهای ویدئویی و سه بعدی به سرعت در حال آمدن منحنی هستند. مردم از پتانسیل این مدل ها برای باز کردن بازارهای خلاق بزرگ مانند سینما ، بازی ، VR ، معماری و طراحی فیزیکی محصولات هیجان زده هستند. ارگان های تحقیقاتی در حال صحبت کردن مدلهای بنیادی سه بعدی و ویدیویی هستند که ما صحبت می کنیم.
  • دامنه های دیگر: مدل اساسی تحقیق و توسعه در بسیاری از زمینه ها اتفاق می افتد ، از صوتی و موسیقی گرفته تا زیست شناسی و شیمی (پروتئین ها و مولکول ها ، هر کسی؟).

نمودار زیر جدول زمانی را برای چگونگی انتظار ما انتظار می رود مدل های اساسی پیشرفت و برنامه های مرتبط با آن را نشان دهیم. 2025 و فراتر از آن فقط یک حدس است.

برنامه های موجود در اینجا برخی از برنامه هایی است که ما از آنها هیجان زده ایم. به مراتب بیشتر از آنچه در این صفحه ضبط کرده ایم وجود دارد ، و ما از برنامه های خلاقانه ای که بنیانگذاران و توسعه دهندگان در حال خواب هستند ، شیفته می شویم.

 

  • نوشتن کپی: نیاز رو به رشد به محتوای وب و ایمیل شخصی برای فروش سوخت و استراتژی های بازاریابی و همچنین پشتیبانی مشتری برنامه های مناسبی برای مدل های زبان است. شکل کوتاه و ماهیت تلطیف شده از لفظی همراه با فشارهای زمان و هزینه در این تیم ها باید تقاضا برای راه حل های خودکار و افزوده را هدایت کند.
  • دستیاران نوشتن خاص عمودی: بیشتر دستیاران نوشتن امروز افقی هستند. ما معتقدیم فرصتی برای ایجاد برنامه های تولیدی بسیار بهتر برای بازارهای نهایی خاص ، از نوشتن قرارداد حقوقی گرفته تا فیلمنامه نویسی وجود دارد. تمایز محصول در اینجا در تنظیم دقیق مدل ها و الگوهای UX برای گردش کار خاص است.
  • تولید کد: برنامه های کاربردی فعلی Turboress توسعه دهندگان و آنها را بسیار تولید می کند: GitHub Copilot اکنون در پروژه هایی که در آن نصب شده است ، تقریباً 40 ٪ کد را تولید می کند. اما فرصت حتی بزرگتر ممکن است دسترسی به برنامه نویسی برای مصرف کنندگان باشد. یادگیری سریع ممکن است به یک زبان برنامه نویسی سطح بالا تبدیل شود.
  • تولید هنر: تمام دنیای تاریخ هنر و فرهنگ های پاپ اکنون در این مدل های بزرگ رمزگذاری شده است و به هر کسی این امکان را می دهد تا مضامین و سبک هایی را به خواست خود کشف کند که قبلاً یک عمر برای تسلط داشته باشد.
  • بازی: این رویا با استفاده از زبان طبیعی برای ایجاد صحنه ها یا مدل های پیچیده ای که قابل استفاده هستند. این حالت پایان احتمالاً مسیری طولانی است ، اما گزینه های فوری بیشتری وجود دارد که در کوتاه مدت مانند تولید بافت و هنر جعبه آسمان قابل اجرا هستند.
  • رسانه/تبلیغات: پتانسیل خودکار سازی کار آژانس و بهینه سازی کپی تبلیغاتی و خلاقیت را در پرواز برای مصرف کنندگان تصور کنید. فرصت های عالی در اینجا برای نسل چند حالته که جفت می شوند پیام هایی را با تصاویر مکمل می فروشند.
  • طراحی: نمونه سازی محصولات دیجیتال و فیزیکی یک فرآیند کار و تکراری است. ارائه های وفاداری بالا از طرح ها و اعلان های خشن در حال حاضر یک واقعیت است. با در دسترس بودن مدل های 3 بعدی ، فرآیند طراحی تولیدی از طریق تولید و تولید گسترش می یابد-متن به شی. برنامه یا کفش ورزشی آیفون بعدی شما ممکن است توسط یک دستگاه طراحی شود.
  • رسانه های اجتماعی و جوامع دیجیتال: آیا روش های جدیدی برای بیان خودمان با استفاده از ابزارهای تولیدی وجود دارد؟برنامه های جدید مانند Midjouey در حال ایجاد تجربیات اجتماعی جدید است زیرا مصرف کنندگان یاد می گیرند که در ملاء عام ایجاد کنند.

 

آناتومی یک برنامه هوش مصنوعی مولد

یک برنامه هوش مصنوعی تولیدی چگونه خواهد بود؟در اینجا برخی از پیش بینی ها آورده شده است.

برنامه های هوش مصنوعی هوشمندانه و مدل تنظیم شده در بالای مدل های بزرگ مانند GPT-3 یا انتشار پایدار ساخته شده اند. از آنجا که این برنامه ها داده های کاربر بیشتری را دریافت می کنند ، می توانند مدل های خود را به خوبی تنظیم کنند: 1) کیفیت/عملکرد مدل را برای فضای مشکل خاص خود بهبود بخشید و. 2) اندازه/هزینه مدل را کاهش دهید.

ما می توانیم برنامه های AI تولیدی را به عنوان یک لایه UI و "مغز کوچک" که در بالای "مغز بزرگ" قرار دارد که مدل های بزرگ با هدف عمومی است ، فکر کنیم.

فاکتور فرم امروز ، برنامه های AI تولیدی عمدتاً به عنوان افزونه هایی در اکوسیستم های نرم افزاری موجود وجود دارند. تکمیل کد در IDE شما اتفاق می افتد. نسل های تصویر در FIGMA یا Photoshop اتفاق می افتد. حتی ربات های Discord کشتی برای تزریق هوش مصنوعی به جوامع دیجیتال/اجتماعی هستند.

همچنین تعداد کمتری از برنامه های وب AI مولد مستقل مانند Jasper و Copy. ai برای نوشتن کپی ، باند برای ویرایش ویدیو و MEM برای یادداشت برداری وجود دارد.

یک افزونه ممکن است یک گوه مؤثر در راه اندازی برنامه های شخصی شما باشد ، و ممکن است یک روش باهوش برای غلبه بر مشکل مرغ و تخم مرغ داده های کاربر و کیفیت مدل باشد (شما برای دستیابی به استفاده کافی برای بهبود مدل های خود به توزیع نیاز دارید ؛ شما نیاز داریدمدل های خوبی برای جذب کاربران). ما دیده ایم که این استراتژی توزیع در سایر دسته های بازار مانند مصرف کننده/اجتماعی پرداخت می شود.

پارادایم تعامل امروز ، بیشتر نسخه های نمایشی هوش مصنوعی "یک و یک کار" هستند: شما یک ورودی را ارائه می دهید ، دستگاه خروجی را بیرون می کشد ، و می توانید آن را نگه دارید یا آن را دور بیندازید و دوباره امتحان کنید. به طور فزاینده ای ، مدل ها تکراری تر می شوند ، جایی که می توانید با خروجی ها برای اصلاح ، ظرافت ، سطح بالا و ایجاد تغییرات کار کنید.

امروزه از خروجی های تولید AI به عنوان نمونه های اولیه یا پیش نویس های اول استفاده می شود. برنامه ها در تفسیر چندین ایده مختلف برای به دست آوردن فرآیند خلاقانه (به عنوان مثال گزینه های مختلف برای یک آرم یا طراحی معماری) بسیار عالی هستند ، و آنها در ارائه پیش نویس های اول که برای رسیدن به حالت نهایی باید توسط کاربر نیاز به ظرافت داشته باشند بسیار عالی هستند (به عنوان مثال. پست های وبلاگ یا کدگذاری خودکار). هرچه مدل ها باهوش تر می شوند ، تا حدی از پشت داده های کاربر خارج می شوند ، باید انتظار داشته باشیم که این پیش نویس ها بهتر و بهتر و بهتر شوند ، تا زمانی که آنها به اندازه کافی مناسب برای استفاده به عنوان محصول نهایی باشند.

رهبری رده پایدار بهترین شرکت های تولید کننده هوش مصنوعی می توانند با اجرای بی امان بر روی پرواز بین تعامل کاربر/داده ها و عملکرد مدل ، یک مزیت رقابتی پایدار ایجاد کنند. برای برنده شدن ، تیم ها باید این پرواز را با 1) درگیری کاربری استثنایی 2) انجام دهند. عملکرد برای هدایت رشد و تعامل بیشتر کاربر. آنها به احتمال زیاد به جای اینکه سعی کنند همه چیز برای همه باشند ، به فضاهای مشکل خاص (به عنوان مثال ، کد ، طراحی ، بازی) می روند. آنها به احتمال زیاد ابتدا در برنامه های کاربردی برای اهرم و توزیع و بعداً تلاش می کنند تا برنامه های فعلی را با گردش کار بومی جایگزین کنند. برای ساختن این برنامه ها به روش صحیح جمع آوری کاربران و داده ها زمان لازم خواهد بود ، اما ما معتقدیم که بهترین ها دوام خواهند داشت و فرصتی برای عظیم شدن دارند.

موانع و خطرات

علیرغم پتانسیل های تولید AI ، تعداد زیادی از مدلهای تجاری و فناوری وجود دارد که می توانند از بین بروند. سؤالات مربوط به موضوعات مهم مانند حق چاپ ، اعتماد و ایمنی و هزینه ها به دور از حل نیست.

چشمان باز است

هوش مصنوعی تولیدی هنوز خیلی زود است. لایه سکو فقط خوب می شود و فضای برنامه به سختی پیش رفته است.

برای روشن شدن ، ما نیازی به مدل های بزرگ زبان برای نوشتن یک رمان تولستوی برای استفاده خوب از هوش مصنوعی تولیدی نداریم. این مدل ها امروز به اندازه کافی خوب هستند تا بتوانند اولین پیش نویس پست های وبلاگ را بنویسند و نمونه های اولیه آرم ها و رابط های محصول را تولید کنند. ایجاد ارزش زیادی وجود دارد که در دوره نزدیک به متوسط اتفاق می افتد.

این اولین موج از برنامه های AI مولد شبیه به منظره برنامه تلفن همراه است که آیفون برای اولین بار بیرون آمد - کمی حیرت انگیز و نازک ، با تمایز رقابتی نامشخص و مدلهای تجاری. با این حال ، برخی از این برنامه ها نگاهی اجمالی به آنچه آینده ممکن است داشته باشد ارائه می دهد. هنگامی که می بینید یک دستگاه کد عملکردی پیچیده یا تصاویر درخشان تولید می کند ، تصور آینده ای دشوار است که ماشین ها نقش اساسی در نحوه کار و ایجاد ما ندارند.

اگر به خودمان اجازه دهیم چندین دهه از خواب رویای خود را داشته باشیم ، به راحتی می توان آینده ای را تصور کرد که هوش مصنوعی تولید عمیق در نحوه کار ، ایجاد و بازی ما تعبیه شده است: یادداشت هایی که خودشان می نویسند. چاپ سه بعدی هر چیزی را که می توانید تصور کنید. از متن به فیلم پیکسار بروید. تجربیات بازی مانند Roblox که به همان سرعتی که می توانیم آنها را در خواب ببینیم ، جهان های غنی را تولید می کنند. در حالی که این تجربیات ممکن است امروز مانند داستان های علمی به نظر برسد ، سرعت پیشرفت فوق العاده بالا است-ما از مدل های زبان باریک به چندین سال به کدگذاری خودکار رفته ایم-و اگر در طول این میزان تغییر ادامه دهیم و از "مدل بزرگ مور" پیروی کنیم. قانون ، "سپس این سناریوهای دور افتاده فقط ممکن است وارد قلمرو ممکن شوند.

برای استارتاپ ها تماس بگیرید

ما در ابتدای تغییر پلتفرم در فناوری هستیم. ما قبلاً سرمایه گذاری های زیادی را در این چشم انداز انجام داده ایم و توسط ساختمان بنیانگذاران جاه طلب در این فضا گالوانیزه شده ایم.

اگر بنیانگذار هستید و دوست دارید ملاقات کنید ، یادداشتی را در sonya@awiacap. com و grady@owniacap. com به ما شلیک کنید.

ما نمی توانیم صبر کنیم تا داستان شما را بشنویم.

PS: این قطعه با GPT-3 نوشته شده است. GPT-3 کل مقاله را تفکیک نکرد ، اما این مسئولیت مبارزه با بلوک نویسنده ، تولید کامل جملات و پاراگراف های متن و طوفان مغزی موارد استفاده متفاوت برای هوش مصنوعی را بر عهده داشت. نوشتن این قطعه با GPT-3 طعم خوبی از تعامل همزمان با ایجاد انسان و رایانه بود که ممکن است حالت عادی جدید را تشکیل دهد. ما همچنین برای این پست با Midjouey تصاویر ایجاد کردیم که بسیار سرگرم کننده بود!

بهترین شرکت های هوش مصنوعی تولیدی می توانند با اجرای بی امان بر روی پرواز بین تعامل کاربر/داده ها و عملکرد مدل ، یک مزیت رقابتی پایدار ایجاد کنند.

هوش مصنوعی تولیدی هنوز خیلی زود است. لایه سکو فقط خوب می شود و فضای برنامه به سختی پیش رفته است.

مدرسه ی فارکس...
ما را در سایت مدرسه ی فارکس دنبال می کنید

برچسب : نویسنده : ارسلان فرهادی بازدید : 36 تاريخ : چهارشنبه 15 شهريور 1402 ساعت: 12:33