با وجود رقابت شدید تسلیحاتی هوش مصنوعی، ما در آینده ای چندوجهی هستیم
انتشار: دی 10، 1403
بروزرسانی: 01 تیر 1404

با وجود رقابت شدید تسلیحاتی هوش مصنوعی، ما در آینده ای چندوجهی هستیم


به خبرنامه های روزانه و هفتگی ما بپیوندید تا آ،ین به روز رس، ها و محتوای انحصاری در زمینه پوشش هوش مصنوعی پیشرو در صنعت را دریافت کنید. بیشتر بد،د


هر هفته - گاهی هر روز - یک مدل جدید هوش مصنوعی پیشرفته در جهان متولد می شود. همانطور که به سال 2025 می رویم، سرعت عرضه مدل های جدید اگر نگوییم خسته کننده است، سرگیجه آور است. منحنی ترن هوایی به طور تصاعدی به رشد خود ادامه می دهد و خستگی و شگفتی به همراهان همیشگی تبدیل شده اند. هر نسخه دلیل آن را برجسته می کند این مدل خاص بهتر از بقیه است، با مجموعه های بی پای، از معیارها و نمودارهای میله ای که فیدهای ما را پر می کنند، در حالی که ما تلاش می کنیم تا ادامه دهیم.

تعداد مدل های فونداسیون بزرگی که هر سال عرضه می شوند از سال 2020 افزایش یافته است
چارلی جیاتینو، ادوارد متیو، ورونیکا سامبورسکا و م، روزر (2023) – «هوش مصنوعی» به صورت آنلاین در سایت OurWorldinData.org منتشر شده است.

هجده ماه پیش، ا،ریت قریب به اتفاق توسعه دهندگان و ،ب و کارها از یک مدل هوش مصنوعی استفاده می ،د. امروز برع، است. به ندرت می توان ،ب و کاری در مقیاس قابل توجهی را پیدا کرد که خود را به قابلیت های یک مدل محدود کند. شرکت ها نسبت به قفل شدن فروشنده ها محتاط هستند، به ویژه برای فناوری که به سرعت به بخش اصلی استراتژی بلندمدت شرکت و درآمد کوتاه مدت تبدیل شده است. برای تیم ها به طور فزاینده ای خطرناک است که همه شرط های خود را روی یک مدل زبان بزرگ (LLM) بگذارند.

اما با وجود این چندپارگی، بسیاری از ارائه دهندگان مدل همچنان از این دیدگاه حمایت می کنند که هوش مصنوعی بازاری است که همه چیز را برنده می کند. آنها ادعا می کنند که تخصص و مح،ات مورد نیاز برای آموزش بهترین مدل های ک، کمیاب، قابل دفاع و خودتقویت کننده است. از منظر آنها، حباب تبلیغاتی برای ساخت مدل های هوش مصنوعی در نهایت فرو می پاشد و یک مدل غول پیکر هوش مصنوعی عمومی (AGI) باقی می ماند که برای همه چیز و همه چیز استفاده می شود. داشتن انحصاری چنین مدلی به م،ای قدرتمندترین شرکت در جهان است. اندازه این جایزه یک مسابقه تسلیحاتی را برای پردازنده های گرافیکی بیشتر و بیشتر آغاز کرده است و هر چند ماه یک بار یک صفر جدید به تعداد پارامترهای آموزشی اضافه می شود.

Deep T،ught، AGI یکپارچه از راهنمای سفر به کیهان
BBC, Hitchhiker\'s Guide to the Galaxy, مجموعه تلویزیونی (1981). تصویر ثابت برای اه، تفسیری بازیابی شد.

ما معتقدیم این دیدگاه اشتباه است. هیچ مدل واحدی وجود نخواهد داشت که بر جهان حاکم باشد، نه سال آینده و نه دهه آینده. در عوض، آینده هوش مصنوعی چند مدل خواهد بود.

مدل های زب، کالاهای مبهم هستند

را فرهنگ لغت اقتصاد آ،فورد کالا را به ،وان "کالای استاندارد شده که در مقیاس ،ید و فروش می شود و واحدهای آن قابل تعویض هستند" تعریف می کند. مدل های زب، از دو جهت مهم کالا هستند:

  1. خود مدل ها در مجموعه وسیع تری از وظایف قابل تعویض هستند.
  2. تخصص تحقیقاتی مورد نیاز برای تولید این مدل ها در حال توزیع و در دسترس تر شدن است، به طوری که آزمایشگاه های مرزی به سختی از یکدیگر پیشی می گیرند و محققان مستقل در جامعه منبع باز به دنبال آن ها هستند.
کالاهایی که کالاها را توصیف می کنند (اعتبار: نه الماس)

اما در حالی که مدل های زب، در حال کا،ازی هستند، این کار را به طور ناهموار انجام می دهند. هسته بزرگی از قابلیت ها وجود دارد که هر مدلی، از GPT-4 تا Mistral Small، کاملاً من، است. در عین حال، همانطور که به سمت حاشیه ها و موارد لبه حرکت می کنیم، شاهد تمایز بیشتر و بیشتر هستیم، به طوری که برخی از ارائه دهندگان مدل به صراحت در تولید کد، استدلال، تولید افزوده شده با بازیابی (RAG) یا ریاضیات تخصص دارند. این منجر به دستنویسی بی پایان، جستجوی reddit، ارزیابی و تنظیم دقیق برای یافتن مدل من، برای هر شغل می شود.

مدل های هوش مصنوعی حول قابلیت های اصلی کالا می شوند و در لبه ها تخصص دارند. اعتبار: نه الماس

و بنابراین، در حالی که مدل های زب، کالا هستند، با دقت بیشتری به ،وان کالا توصیف می شوند کالاهای فازی. برای بسیاری از موارد استفاده، مدل های هوش مصنوعی تقریباً قابل تعویض هستند، با معیارهایی مانند قیمت و تأخیر که تعیین می کنند از کدام مدل استفاده شود. اما در لبه توانایی ها، برع، این اتفاق خواهد افتاد: مدل ها به تخصصی شدن ادامه می دهند و بیشتر و بیشتر متمایز می شوند. به ،وان مثال، Deepseek-V2.5 در کدنویسی در سی شارپ از GPT-4o قوی تر است، علیرغم اینکه ،ری از اندازه و 50 برابر ارزان تر است.

هر دوی این پویایی ها - کالایی شدن و تخصصی شدن - این تز را ریشه کن می کنند که یک مدل واحد برای رسیدگی به هر مورد استفاده ممکن به بهترین وجه من، است. در عوض، آنها به سمت یک چشم انداز تدریجی تکه تکه شده برای هوش مصنوعی اشاره می کنند.

ار،تراسیون و مسیریابی چند وجهی

یک قیاس من، برای پویایی بازار مدل های زبان وجود دارد: مغز انسان. ساختار مغز ما به مدت 100000 سال بدون تغییر باقی مانده است و مغزها بسیار شبیه تر از ناهمس، هستند. در ا،ریت قریب به اتفاق زمان ما بر روی زمین، ا،ر مردم چیزهای مشابهی یاد می گرفتند و توانایی های مشابهی داشتند.

اما بعد چیزی تغییر کرد. ما توانایی برقراری ارتباط به زبان را توسعه دادیم - ابتدا در گفتار، سپس در نوشتار. پروتکل های ارتباطی شبکه ها را تسهیل می کنند و زم، که انسان ها شروع به شبکه سازی با یکدیگر ،د، ما نیز به درجات بیشتری تخصص پیدا کردیم. ما از بار نیاز به کلی گرایی در همه حوزه ها و جزایر خودکفا رها شدیم. به طرز متناقضی، ثروت جمعی از تخصص نیز به این م،ی است که انسان معمولی امروز یک کلی گرا به مراتب قوی تر از هر یک از اجداد ما است.

در یک فضای ورودی به اندازه کافی گسترده، جهان همیشه به سمت تخصص گرایش دارد. این از شیمی مولکولی گرفته تا زیست شناسی و جامعه انس، صادق است. با توجه به تنوع کافی، سیستم های توزیع شده همیشه از نظر مح،اتی کارآمدتر از یکپارچه ها خواهند بود. ما معتقدیم که همین امر در مورد هوش مصنوعی نیز صادق خواهد بود. هر چه بیشتر بتو،م به جای تکیه بر یک مدل از نقاط قوت چند مدل استفاده کنیم، آن مدل ها بیشتر می توانند تخصصی شوند و مرز قابلیت ها را گسترش دهیم.

سیستم های چند مدل می توانند تخصص، قابلیت و کارایی بیشتری را فراهم کنند. منبع: نه الماس

یک الگوی فزاینده مهم برای استفاده از نقاط قوت مدل های متنوع، مسیریابی است - ارسال پویا پرس و جوها به بهترین مدل، در حالی که استفاده از مدل های ارزان تر و سریع تر در صورت انجام این کار، کیفیت را کاهش نمی دهد. مسیریابی به ما این امکان را می دهد که از تمام مزایای تخصص - دقت بالاتر با هزینه کمتر و تأخیر - بدون چشم پوشی از استحکام تعمیم استفاده کنیم.

یک نمایش ساده از قدرت مسیریابی را می توان در این واقعیت مشاهده کرد که بیشتر مدل های برتر دنیا خودشان روتر هستند: آنها با استفاده از آنها ساخته شده اند. ،یبی از متخصص معماری هایی که هر نسل توکن بعدی را به چند ده مدل فرعی خبره هدایت می کنند. اگر این درست است که LLM ها به طور تصاعدی در حال ت،یر کالاهای فازی هستند، مسیریابی باید به بخشی ضروری از هر پشته هوش مصنوعی تبدیل شود.

این دیدگاه وجود دارد که LLM ها با دستیابی به هوش انس، بالا خواهند رفت – که با اشباع کامل قابلیت ها، به همان روشی که در اطراف AWS یا آیفون ادغام شده ایم، حول یک مدل کلی ادغام خواهیم شد. هیچکدام از این پلتفرم ها (یا رقبایشان) توانایی های خود را در چند سال گذشته 10 برابر نکرده اند – بنابراین ممکن است ما در ا،یستم های آنها راحت باشیم. با این حال، ما معتقدیم که هوش مصنوعی در هوش سطح انس، متوقف نخواهد شد. آن محدودیت هایی را که ما حتی تصور می کنیم، از گذشته دور خواهد کرد. با انجام این کار، به طور فزاینده ای تکه تکه و تخصصی می شود، درست مانند هر سیستم طبیعی دیگری.

ما نمی تو،م اغراق کنیم که تکه تکه شدن مدل هوش مصنوعی چقدر چیز خوبی است. بازارهای تکه تکه، بازارهای کارآمدی هستند: آنها به ،یداران قدرت می دهند، نوآوری را به حدا،ر می رسانند و هزینه ها را به حداقل می رسانند. و تا جایی که بتو،م از شبکه های مدل های کوچک تر و تخصصی تر به جای ارسال همه چیز از طریق داخلی یک مدل غول پیکر استفاده کنیم، به سمت آینده ای امن تر، قابل تفسیرتر و هدایت پذیرتر برای هوش مصنوعی حرکت می کنیم.

بزرگترین اختراعات صاحبی ندارند. وارثان بن فرانکلین صاحب برق نیستند. املاک تورینگ مالک همه کامپیوترها نیست. هوش مصنوعی بدون شک یکی از بزرگترین اختراعات بشر است. ما معتقدیم آینده آن چند مدل خواهد بود - و باید باشد.

زک کاس رئیس سابق بازارهای فروش در OpenAI.

توماس هرناندو کوفمن یکی از بنیانگذاران و مدیر عامل شرکت است نه الماس.

DataDecisionMakers

به انجمن VentureBeat خوش آمدید!

DataDecisionMakers جایی است که کارشناسان، از جمله افراد فنی که کار داده را انجام می دهند، می توانند بینش ها و نوآوری های مرتبط با داده را به اشتراک بگذارند.

اگر می خواهید درباره ایده های پیشرفته و اطلاعات به روز، بهترین شیوه ها و آینده فناوری داده و داده مطالعه کنید، به ما در DataDecisionMakers بپیوندید.

شما حتی ممکن است در نظر داشته باشید که مقاله ای از خودتان مشارکت دهید!

از DataDecisionMakers بیشتر بخو،د



منبع: https://venturebeat.com/ai/despite-heated-ai-arms-race-were-in-for-a-multi-modal-future/