**المعجم الشامل للذكاء الاصطناعي: مفاهيم أساسية تحتاجها هذا العام**
يُعيد الذكاء الاصطناعي صياغة العالم بوتيرة متسارعة، ويصاحب ذلك ظهور لغة جديدة بالكامل لوصف آلياته وعملياته. فمن الصعب الآن حضور أي اجتماع منتجات أو عرض تقديمي أو ندوة دون سماع مصطلحات مثل LLMs و RAG و RLHF، وعشرات غيرها، مما قد يُشعر حتى أذكى المتخصصين في عالم التكنولوجيا بالارتباك. يهدف هذا المسرد، المُقدم من TechCrunch، إلى معالجة هذا التحدي: توفير تعريفات واضحة ومبسطة لمصطلحات الذكاء الاصطناعي التي من المرجح أن تصادفها، سواء كنت تعمل على بناء هذه الأنظمة، أو تستثمر فيها، أو مجرد تحاول مواكبة التطورات من خلال قراءة TechCrunch أو الاستماع إلى المدونات الصوتية المتخصصة. سنقوم بتحديث هذا الدليل بانتظام مع تطور المجال، ليكون بمثابة وثيقة حية، تمامًا مثل أنظمة الذكاء الاصطناعي التي يصفها.
**مصطلحات الذكاء الاصطناعي الأساسية:**
* **الذكاء الاصطناعي العام (AGI):**
مصطلح غامض إلى حد ما، لكنه يشير عمومًا إلى أنظمة ذكاء اصطناعي تتفوق على الإنسان العادي في العديد، إن لم يكن معظم، المهام. وصف سام ألتمان، الرئيس التنفيذي لـ OpenAI، الذكاء الاصطناعي العام بأنه "معادل لإنسان متوسط يمكنك توظيفه كزميل في العمل". بينما يُعرّف ميثاق OpenAI الذكاء الاصطناعي العام بأنه "أنظمة ذاتية التحكم بدرجة عالية وتتفوق على البشر في معظم الأعمال ذات القيمة الاقتصادية". يختلف فهم Google DeepMind قليلاً، حيث يعتبرون الذكاء الاصطناعي العام "ذكاءً اصطناعيًا قادرًا على الأقل على مستوى البشر في معظم المهام المعرفية". هل تشعر بالارتباك؟ لا تقلق، فالخبراء في طليعة أبحاث الذكاء الاصطناعي كذلك.
* **وكيل الذكاء الاصطناعي (AI Agent):**
يشير إلى أداة تستخدم تقنيات الذكاء الاصطناعي لأداء سلسلة من المهام نيابةً عنك، متجاوزة ما يمكن أن يفعله روبوت الدردشة الأساسي بالذكاء الاصطناعي. يمكن لوكيل الذكاء الاصطناعي إنجاز مهام مثل تقديم فواتير المصروفات، أو حجز التذاكر أو طاولة في مطعم، أو حتى كتابة التعليمات البرمجية وصيانتها. ومع ذلك، وكما أوضحنا سابقًا، هناك العديد من المفاهيم المتغيرة في هذا المجال الناشئ، لذا قد يعني "وكيل الذكاء الاصطناعي" أشياء مختلفة لأشخاص مختلفين. لا تزال البنية التحتية قيد الإنشاء لتقديم قدراته المتصورة. لكن المفهوم الأساسي يشير إلى نظام مستقل قد يعتمد على أنظمة ذكاء اصطناعي متعددة لتنفيذ مهام متعددة الخطوات.
* **نقاط نهاية واجهة برمجة التطبيقات (API Endpoints):**
يمكن التفكير في نقاط نهاية واجهة برمجة التطبيقات (API) على أنها "أزرار" على الجزء الخلفي من برنامج يمكن للبرامج الأخرى الضغط عليها لجعلها تقوم بأشياء. يستخدم المطورون هذه الواجهات لبناء عمليات التكامل؛ على سبيل المثال، السماح لتطبيق بسحب البيانات من تطبيق آخر، أو تمكين وكيل ذكاء اصطناعي من التحكم في خدمات خارجية مباشرة دون تدخل بشري يدوي في كل واجهة. تحتوي معظم أجهزة المنزل الذكي والمنصات المتصلة على هذه الأزرار المخفية المتاحة، حتى لو لم يرها المستخدمون العاديون أو يتفاعلوا معها. مع تزايد قدرات وكلاء الذكاء الاصطناعي، أصبحوا قادرين بشكل متزايد على العثور على نقاط النهاية هذه واستخدامها بأنفسهم، مما يفتح إمكانيات قوية – وأحيانًا غير متوقعة – للأتمتة.
* **التفكير المتسلسل (Chain-of-Thought Reasoning):**
عندما يُطرح سؤال بسيط، يمكن للدماغ البشري الإجابة دون تفكير كبير، مثل "أي الحيوانين أطول، الزرافة أم القطة؟". لكن في كثير من الحالات، تحتاج غالبًا إلى قلم وورقة للوصول إلى الإجابة الصحيحة لأن هناك خطوات وسيطة. على سبيل المثال، إذا كان لدى مزارع دجاج وأبقار، ولديهم معًا 40 رأسًا و120 ساقًا، فقد تحتاج إلى كتابة معادلة بسيطة للوصول إلى الإجابة (20 دجاجة و20 بقرة). في سياق الذكاء الاصطناعي، يعني التفكير المتسلسل لـ **نماذج اللغة الكبيرة (LLMs)** تقسيم المشكلة إلى خطوات وسيطة أصغر لتحسين جودة النتيجة النهائية. يستغرق الأمر عادةً وقتًا أطول للحصول على إجابة، ولكن الإجابة تكون أكثر احتمالاً أن تكون صحيحة، خاصة في سياق المنطق أو البرمجة. يتم تطوير نماذج التفكير من نماذج اللغة الكبيرة التقليدية وتحسينها للتفكير المتسلسل بفضل التعلم المعزز. هذا مفهوم أكثر تحديدًا من "وكيل الذكاء الاصطناعي"، الذي يعني برنامجًا يمكنه اتخاذ إجراءات بمفرده، خطوة بخطوة، لإكمال هدف ما.
* **وكيل البرمجة (Coding Agent):**
هو نسخة متخصصة من وكيل الذكاء الاصطناعي تُطبق على تطوير البرمجيات. بدلاً من مجرد اقتراح التعليمات البرمجية ليقوم الإنسان بمراجعتها ولصقها، يمكن لوكيل البرمجة كتابة التعليمات البرمجية واختبارها وتصحيحها بشكل مستقل، والتعامل مع العمل المتكرر القائم على التجربة والخطأ الذي يستهلك عادةً يوم المطور. يمكن لهذه الوكلاء العمل عبر قواعد بيانات التعليمات البرمجية بأكملها، واكتشاف الأخطاء، وتشغيل الاختبارات، ودفع الإصلاحات بأقل قدر من الإشراف البشري. فكر في الأمر وكأنك توظف متدربًا سريعًا جدًا لا ينام أبدًا ولا يفقد تركيزه – على الرغم من أنه، كما هو الحال مع أي متدرب، لا يزال يتعين على الإنسان مراجعة العمل.
* **القدرة الحاسوبية (Compute):**
على الرغم من كونه مصطلحًا متعدد الأوجه إلى حد ما، إلا أن "القدرة الحاسوبية" تشير عمومًا إلى القوة الحاسوبية الحيوية التي تسمح لنماذج الذكاء الاصطناعي بالعمل. هذا النوع من المعالجة يُغذي صناعة الذكاء الاصطناعي، ويمنحها القدرة على تدريب ونشر نماذجها القوية. يُستخدم المصطلح غالبًا كاختصار لأنواع الأجهزة التي توفر هذه القوة الحاسوبية - مثل وحدات معالجة الرسوميات (GPUs)، ووحدات المعالجة المركزية (CPUs)، ووحدات معالجة الموترات (TPUs)، وغيرها من أشكال البنية التحتية التي تشكل حجر الزاوية في صناعة الذكاء الاصطناعي الحديثة.
* **التعلم العميق (Deep Learning):**
مجموعة فرعية من التعلم الآلي ذاتي التحسين حيث يتم تصميم خوارزميات الذكاء الاصطناعي بهيكل شبكة عصبية اصطناعية (ANN) متعدد الطبقات. يسمح هذا لها بإجراء ارتباطات أكثر تعقيدًا مقارنة بأنظمة التعلم الآلي الأبسط، مثل النماذج الخطية أو أشجار القرار. يستوحي هيكل خوارزميات التعلم العميق الإلهام من المسارات المترابطة للخلايا العصبية في الدماغ البشري. تستطيع نماذج الذكاء الاصطناعي للتعلم العميق تحديد الخصائص المهمة في البيانات بنفسها، بدلاً من مطالبة المهندسين البشريين بتعريف هذه الميزات. يدعم الهيكل أيضًا الخوارزميات التي يمكنها التعلم من الأخطاء، ومن خلال عملية التكرار والتعديل، تحسين مخرجاتها. ومع ذلك، تتطلب أنظمة التعلم العميق الكثير من نقاط البيانات لتقديم نتائج جيدة (ملايين أو أكثر). كما أنها تستغرق وقتًا أطول للتدريب مقارنة بخوارزميات التعلم الآلي الأبسط، لذا تميل تكاليف التطوير إلى الارتفاع.
* **الانتشار (Diffusion):**
هي التقنية الأساسية للعديد من نماذج الذكاء الاصطناعي التي تولد الفن والموسيقى والنصوص. مستوحاة من الفيزياء، تعمل أنظمة الانتشار على "تدمير" بنية البيانات ببطء – على سبيل المثال، الصور والأغاني وما إلى ذلك – عن طريق إضافة الضوضاء حتى لا يبقى شيء. في الفيزياء، يكون الانتشار تلقائيًا وغير قابل للعكس – السكر المذاب في القهوة لا يمكن إعادته إلى شكل مكعب. لكن أنظمة الانتشار في الذكاء الاصطناعي تهدف إلى تعلم نوع من عملية "الانتشار العكسي" لاستعادة البيانات المدمرة، واكتساب القدرة على استعادة البيانات من الضوضاء.
* **التقطير (Distillation):**
تقنية تُستخدم لاستخلاص المعرفة من نموذج ذكاء اصطناعي كبير باستخدام نموذج "معلم-طالب". يرسل المطورون طلبات إلى نموذج المعلم ويسجلون المخرجات. أحيانًا تتم مقارنة الإجابات بمجموعة بيانات لمعرفة مدى دقتها. ثم تُستخدم هذه المخرجات لتدريب نموذج الطالب، والذي يتم تدريبه على تقريب سلوك المعلم. يمكن استخدام التقطير لإنشاء نموذج أصغر وأكثر كفاءة بناءً على نموذج أكبر مع الحد الأدنى من فقدان التقطير. من المحتمل أن تكون هذه هي الطريقة التي طورت بها OpenAI نموذج GPT-4 Turbo، وهو نسخة أسرع من GPT-4. بينما تستخدم جميع شركات الذكاء الاصطناعي التقطير داخليًا، فقد تم استخدامه أيضًا من قبل بعض شركات الذكاء الاصطناعي للحاق بالنماذج الرائدة. عادةً ما ينتهك التقطير من المنافس شروط خدمة واجهات برمجة تطبيقات الذكاء الاصطناعي ومساعدي الدردشة.
* **الضبط الدقيق (Fine-tuning):**
يشير هذا المصطلح إلى التدريب الإضافي لنموذج الذكاء الاصطناعي لتحسين الأداء لمهمة أو مجال أكثر تحديدًا مما كان التركيز عليه سابقًا في تدريبه - عادةً عن طريق إدخال بيانات جديدة متخصصة (أي موجهة نحو مهمة معينة). تتخذ العديد من الشركات الناشئة في مجال الذكاء الاصطناعي نماذج اللغة الكبيرة كنقطة بداية لبناء منتج تجاري، ولكنها تتنافس لزيادة الفائدة لقطاع أو مهمة مستهدفة من خلال استكمال دورات التدريب المبكرة بالضبط الدقيق بناءً على معرفتها وخبرتها الخاصة بالمجال.
* **الشبكة التوليدية التنافسية (GAN - Generative Adversarial Network):**
نوع من إطار عمل التعلم الآلي الذي يدعم بعض التطورات المهمة في الذكاء الاصطناعي التوليدي عندما يتعلق الأمر بإنتاج بيانات واقعية - بما في ذلك (وليس فقط) أدوات التزييف العميق (deepfake). تتضمن الشبكات التوليدية التنافسية استخدام زوج من الشبكات العصبية، إحداهما تعتمد على بياناتها التدريبية لتوليد مخرج يتم تمريره إلى النموذج الآخر لتقييمه. يتم برمجة النموذجين أساسًا لمحاولة التفوق على بعضهما البعض. يحاول المولد تمرير مخرجاته على المُفرِّق، بينما يعمل المُفرِّق على اكتشاف البيانات المُولدة بشكل اصطناعي. يمكن لهذه المنافسة المنظمة تحسين مخرجات الذكاء الاصطناعي لتكون أكثر واقعية دون الحاجة إلى تدخل بشري إضافي. على الرغم من أن الشبكات التوليدية التنافسية تعمل بشكل أفضل للتطبيقات الأضيق (مثل إنتاج صور أو مقاطع فيديو واقعية)، بدلاً من الذكاء الاصطناعي للأغراض العامة.
* **الهلوسة (Hallucination):**
هو المصطلح المفضل في صناعة الذكاء الاصطناعي لوصف نماذج الذكاء الاصطناعي التي "تختلق" معلومات غير صحيحة. من الواضح أنها مشكلة كبيرة لجودة الذكاء الاصطناعي. تنتج الهلوسة مخرجات توليدية للذكاء الاصطناعي يمكن أن تكون مضللة وقد تؤدي حتى إلى مخاطر في الحياة الواقعية - مع عواقب قد تكون خطيرة (مثل استعلام صحي يعود بنصيحة طبية ضارة). يُعتقد أن مشكلة اختلاق الذكاء الاصطناعي للمعلومات تنشأ نتيجة لثغرات في بيانات التدريب. تساهم الهلوسة في الدفع نحو نماذج ذكاء اصطناعي متخصصة و/أو عمودية بشكل متزايد - أي أنظمة ذكاء اصطناعي خاصة بالمجال تتطلب خبرة أضيق - كوسيلة لتقليل احتمالية وجود ثغرات معرفية وتقليص مخاطر المعلومات المضللة.
* **الاستدلال (Inference):**
هو عملية تشغيل نموذج ذكاء اصطناعي. إنه إطلاق العنان لنموذج لإجراء تنبؤات أو استخلاص استنتاجات من بيانات لم يراها مسبقًا. للتوضيح، لا يمكن أن يحدث الاستدلال بدون تدريب؛ يجب أن يتعلم النموذج الأنماط في مجموعة من البيانات قبل أن يتمكن من الاستقراء بفعالية من بيانات التدريب هذه. يمكن لأنواع عديدة من الأجهزة أداء الاستدلال، تتراوح من معالجات الهواتف الذكية إلى وحدات معالجة الرسوميات القوية إلى مسرعات الذكاء الاصطناعي المصممة خصيصًا. لكن ليس كل منها يمكنه تشغيل النماذج بنفس الجودة. ستستغرق النماذج الكبيرة جدًا أعمارًا لإجراء تنبؤات على، على سبيل المثال، جهاز كمبيوتر محمول مقابل خادم سحابي مزود برقائق ذكاء اصطناعي متطورة.
* **نماذج اللغة الكبيرة (LLMs - Large Language Models):**
هي نماذج الذكاء الاصطناعي المستخدمة من قبل المساعدين الشخصيين الشائعين للذكاء الاصطناعي، مثل ChatGPT و Claude و Google Gemini و Meta AI Llama و Microsoft Copilot أو Mistral Le Chat. عند الدردشة مع مساعد ذكاء اصطناعي، فإنك تتفاعل مع نموذج لغة كبير يعالج طلبك مباشرة أو بمساعدة أدوات مختلفة متاحة، مثل تصفح الويب أو مفسرات التعليمات البرمجية. نماذج اللغة الكبيرة هي شبكات عصبية عميقة تتكون من مليارات المعاملات الرقمية (أو الأوزان، انظر أدناه) التي تتعلم العلاقات بين الكلمات والعبارات وتنشئ تمثيلاً للغة، نوعًا من الخريطة متعددة الأبعاد للكلمات. تُنشأ هذه النماذج من ترميز الأنماط التي تجدها في مليارات الكتب والمقالات والنصوص. عندما تقوم بتوجيه سؤال أو أمر لنموذج لغة كبير، يُولد النموذج النمط الأكثر احتمالاً الذي يتناسب مع التوجيه.
* **الذاكرة المخبأة (Memory Cache):**
تشير إلى عملية مهمة تعزز الاستدلال (وهي العملية التي يعمل بها الذكاء الاصطناعي لتوليد استجابة لاستعلام المستخدم). في جوهرها، التخزين المؤقت هو تقنية تحسين، مصممة لجعل الاستدلال أكثر كفاءة. يعتمد الذكاء الاصطناعي بشكل واضح على العمليات الحسابية الرياضية عالية الأداء، وفي كل مرة تُجرى فيها هذه العمليات الحسابية، فإنها تستهلك المزيد من الطاقة. يهدف التخزين المؤقت إلى تقليل عدد العمليات الحسابية التي قد يحتاج النموذج إلى تشغيلها عن طريق حفظ عمليات حسابية معينة لاستعلامات المستخدم والعمليات المستقبلية. توجد أنواع مختلفة من التخزين المؤقت للذاكرة، على الرغم من أن أحد أشهرها هو التخزين المؤقت للزوج (Key-Value) أو (KV). يعمل التخزين المؤقت للزوج في النماذج القائمة على المحولات (Transformer-based models)، ويزيد الكفاءة، مما يؤدي إلى نتائج أسرع عن طريق تقليل مقدار الوقت (والجهد الخوارزمي) الذي يستغرقه لإنشاء إجابات لأسئلة المستخدم.
* **بروتوكول سياق النموذج (MCP - Model Context Protocol):**
معيار مفتوح يسمح لنماذج الذكاء الاصطناعي بالاتصال بالأدوات والبيانات الخارجية - ملفاتك، قواعد بياناتك، أو تطبيقات مثل Slack و Google Drive - دون الحاجة إلى قيام المطور ببناء موصل مخصص لكل زوج. فكر في الأمر كمنفذ USB-C للذكاء الاصطناعي. قدمت Anthropic بروتوكول MCP في عام 2024 ثم سلمته لاحقًا إلى مؤسسة Linux، ومنذ ذلك الحين تم تبنيه من قبل OpenAI و Google و Microsoft، مما يجعله أحد أسرع المعايير انتشارًا في تاريخ الذكاء الاصطناعي الحديث.
* **مزيج الخبراء (MoE - Mixture of Experts):**
هندسة نموذجية تقسم الشبكة العصبية إلى العديد من الشبكات الفرعية المتخصصة الأصغر، أو "الخبراء"، وتُفعّل عددًا قليلاً منها فقط لأي مهمة معينة. بدلاً من توجيه كل طلب عبر النموذج بأكمله – مثل استدعاء مكتبك بالكامل لكل سؤال – يحتوي نموذج MoE على "موجّه" مدمج يختار المتخصصين المناسبين تمامًا للمهمة. هذا يجعل من الممكن بناء نماذج ضخمة تظل سريعة نسبيًا ورخيصة التشغيل، حيث أن جزءًا صغيرًا فقط من الشبكة يقوم بالعمل في أي وقت واحد. يُعد نموذج Mixtral من Mistral AI مثالًا معروفًا؛ ويُعتقد أيضًا على نطاق واسع أن نماذج GPT الأحدث من OpenAI تستخدم نسخة من هذا النهج، على الرغم من أن الشركة لم تؤكد ذلك رسميًا مطلقًا.
* **الشبكة العصبية (Neural Network):**
تشير إلى الهيكل الخوارزمي متعدد الطبقات الذي يدعم التعلم العميق - وبشكل أوسع، الطفرة الكاملة في أدوات الذكاء الاصطناعي التوليدية بعد ظهور نماذج اللغة الكبيرة. على الرغم من أن فكرة استلهام المسارات المترابطة بكثافة في الدماغ البشري كهيكل تصميم لخوارزميات معالجة البيانات تعود إلى الأربعينات، إلا أن التطور الأحدث بكثير لأجهزة المعالجة الرسومية (GPUs) - عبر صناعة ألعاب الفيديو - هو الذي أطلق العنان حقًا لقوة هذه النظرية. أثبتت هذه الرقائق أنها مناسبة تمامًا لتدريب الخوارزميات التي تحتوي على طبقات أكثر بكثير مما كان ممكنًا في العصور السابقة - مما مكن أنظمة الذكاء الاصطناعي القائمة على الشبكات العصبية من تحقيق أداء أفضل بكثير عبر العديد من المجالات، بما في ذلك التعرف على الصوت، والملاحة الذاتية، واكتشاف الأدوية.
* **المصدر المفتوح (Open Source) مقابل المصدر المغلق (Closed Source):**
يشير **المصدر المفتوح** إلى البرمجيات - أو بشكل متزايد، نماذج الذكاء الاصطناعي - حيث يتم إتاحة الكود الأساسي للجمهور ليستخدمه أي شخص ويفحصه ويعدله. في عالم الذكاء الاصطناعي، تُعد عائلة نماذج Llama من Meta مثالًا بارزًا؛ ولينكس هو التوازي التاريخي الشهير في أنظمة التشغيل. تسمح منهجيات المصدر المفتوح للباحثين والمطورين والشركات حول العالم بالبناء على عمل بعضهم البعض، مما يسرع التقدم ويمكّن من إجراء عمليات تدقيق مستقلة للسلامة لا يمكن للأنظمة المغلقة توفيرها بسهولة.
أما **المصدر المغلق** فيعني أن الكود خاص - يمكنك استخدام المنتج ولكن لا يمكنك رؤية كيفية عمله، كما هو الحال مع نماذج GPT من OpenAI - وهو تمييز أصبح أحد النقاشات الرئيسية في صناعة الذكاء الاصطناعي.
* **الموازاة (Parallelization):**
تعني القيام بالعديد من الأشياء في نفس الوقت بدلاً من واحد تلو الآخر - مثل وجود 10 موظفين يعملون على أجزاء مختلفة من مشروع في نفس الوقت بدلاً من موظف واحد يقوم بكل شيء بالتسلسل. في الذكاء الاصطناعي، تُعد الموازاة أمرًا أساسيًا لكل من التدريب والاستدلال: تم تصميم وحدات معالجة الرسوميات (GPUs) الحديثة خصيصًا لإجراء آلاف العمليات الحسابية بالتوازي، وهذا سبب كبير في أنها أصبحت العمود الفقري للأجهزة في الصناعة. مع تزايد تعقيد أنظمة الذكاء الاصطناعي وتزايد حجم النماذج، أصبحت القدرة على موازاة العمل عبر العديد من الرقائق والعديد من الأجهزة أحد أهم العوامل في تحديد مدى سرعة وفعالية تكلفة بناء النماذج ونشرها. أصبح البحث في استراتيجيات الموازاة الأفضل مجالًا دراسيًا قائمًا بذاته.
المصدر: عرض الخبر الأصلي
ليست هناك تعليقات:
إرسال تعليق