مؤشر
أي شخص يسأل كيف شات جي بي تيفي حين تعمل أكثر وكلاء الذكاء الاصطناعي شعبية اليوم، فإن العديد من الناس سيكون لديهم الإجابة على طرف ألسنتهم: الذكاء الاصطناعي. لكن هذه الإجابة غامضة جدًا. على الرغم من كونه أحد مجالات الدراسة التي شهدت أعظم الأبحاث والتطوير في مجال الحوسبة اليوم، إلا أن الذكاء الاصطناعي يشمل العديد من الموضوعات العلمية.
أحد هذه العوامل هو المفتاح وراء كيفية عمل ChatGPT ومعظم وكلاء الذكاء الاصطناعي المتوفرين على الويب: LLMs. في هذه المقالة سوف نستكشف بالتفصيل كيف أحدث هذا المفهوم ثورة في الذكاء الاصطناعي وعالمنا.
ما هي نماذج اللغة الكبيرة (LLMs)؟
نماذج اللغات الكبيرة (LLMs، نماذج اللغة الكبيرة، باللغة البرتغالية) هي خوارزميات لـ تعلم عميق (التعلم العميق، باللغة البرتغالية) قادر على أداء سلسلة من المهام معالجة اللغات الطبيعية (معالجة اللغة الطبيعية، باللغة البرتغالية). أوه، هناك الكثير من الاختصارات، أليس كذلك؟
يستخدم طلاب الماجستير في القانون نماذج المحولات ويتم تدريبهم باستخدام مجموعات بيانات ضخمة. بعض الأمثلة على مجموعات البيانات الشائعة هي: LAION-2B-en, CCAW e ويكي النص-103. قد يبدو نموذج المحول وكأنه روبوت يتحول إلى سيارة، ولكن في مجال الذكاء الاصطناعي فهو النموذج المعماري الأكثر شيوعًا لدرجة الماجستير في القانون.
يتكون المحول من التشفير (المشفر، باللغة البرتغالية) و فك (فك التشفير، باللغة البرتغالية). بشكل أساسي، يكون المشفر مسؤولاً عن فصل كلمات الجملة أو النص إلى أجزاء صغيرة تسمى الرموز، ويقوم فك التشفير بإجراء عمليات رياضية لتحديد العلاقات بين هذه الرموز.

الفرق الكبير بين المحولات والهندسة المعمارية المستخدمة منذ سنوات، LSTM (ذاكرة طويلة المدىالميزة الأساسية في الذاكرة طويلة المدى (أو الذاكرة قصيرة المدى الطويلة)، هي أن المحولات تعمل بآليات الانتباه الذاتي، أي أنها قادرة على التعلم بشكل أسرع عند النظر في أجزاء من الجملة أو حتى سياقها، لتوليد التنبؤات.
تعتبر أنظمة الذكاء الاصطناعي متعددة الاستخدامات، فبالإضافة إلى قدرتها على معالجة اللغة البشرية، يمكنها أيضًا القيام بمهام أخرى مثل تحليل هياكل البروتين وتوليد أكواد البرمجة. لكي تعمل بكفاءة، تتطلب برامج الماجستير في القانون تدريبًا مسبقًا وضبطًا دقيقًا للتعامل مع وظائف مثل تصنيف النصوص والتلخيص والإجابة على الأسئلة، مما يجعلها ذات قيمة لصناعات مثل الرعاية الصحية والتمويل والترفيه.
المكونات الرئيسية
تتكون برامج الماجستير في القانون من طبقات متعددة من الشبكات العصبية. في الشبكة العصبية (الشبكة العصبيةفي الأساس، يتم استخدام متغير كمدخل، ويتم معالجته بأوزان مختلفة ومعادلات رياضية بواسطة طبقة واحدة أو أكثر، ويتم إنشاء قيمة إخراج.
النوع الأول من الشبكات العصبية الموجودة في LLMs هي طبقة التضمين (طبقة التضمين، باللغة الإنجليزية). وهو المسؤول عن عملية التضمين، والتقاط الدلالات والمعنى النحوي للمدخلات، حتى يتمكن النموذج من فهم السياق.
ثم لدينا طبقة التغذية الأمامية (FFN، Feedforward Network، باللغة الإنجليزية) والتي تتكون من طبقات متعددة مترابطة تعمل على تحويل مدخلات التضمين. في هذه العملية، تسمح هذه الطبقات للنموذج بجمع تجريدات ذات مستوى أعلى، أي فهم نية المستخدم من خلال إدخال النص.

بعد ذلك، لدينا الطبقة المتكررة التي تقوم بتفسير الكلمات الموجودة في النص المدخل بالتسلسل. فهو المسؤول عن التقاط العلاقة بين الكلمات في الجملة.
وأخيرًا وليس آخرًا، لدينا آلية الاهتمام التي تسمح لـ LLM بالتركيز على أجزاء فردية من النص المدخل والتي تتعلق بالمهمة الموكلة إليه. تسمح هذه الطبقة للنموذج بإنشاء المخرجات الأكثر ملاءمة ودقة.
كيف هؤلاء يعملون
الآن بعد أن عرفنا ما هي برامج الماجستير في القانون وما هي مكوناتها الرئيسية، يمكننا أن نفهم بشكل أوضح كيفية عملها. بشكل أساسي، تقوم وحدات التعلم الآلي المعتمدة على المحولات بأخذ مدخلات وترميزها ثم فك ترميزها لإنتاج مخرجات متوقعة. ومع ذلك، قبل أن يتمكن برنامج LLM من أخذ نص مدخل وإنشاء إخراج متوقع، فإنه يحتاج إلى التدريب على أداء الوظائف العامة والضبط الدقيق لتمكينه من أداء مهام محددة.
التدريب المسبق (التدريب قبل(باللغة الإنجليزية) هي عملية كلاسيكية في مجال التعلم الالي (تعلم آلة(باللغة الإنجليزية) ضمن مجال الذكاء الاصطناعي. تتكون هذه العملية، كما يوحي الاسم، من تدريب مسبق لطلاب الماجستير في القانون باستخدام مجموعات بيانات نصية كبيرة تحتوي على تريليونات الكلمات من مواقع الويب مثل ويكيبيديا, GitHub جيثب:، بين الآخرين. في نهاية المطاف، يحتاج خريجو القانون إلى التعلم من مكان ما، مثل الطفل الصغير، أليس كذلك؟
خلال هذه المرحلة، يقوم طالب الماجستير في القانون بما يسمى بالتعلم غير الخاضع للإشراف (تعليم غير مشرف عليه(باللغة الإنجليزية) - عملية يتم فيها قراءة مجموعات البيانات ببساطة دون تعليمات معالجة محددة. بمعنى آخر، بدون "مدرس"، تكون خوارزمية الذكاء الاصطناعي الخاصة ببرنامج الماجستير في القانون مسؤولة عن تعلم معنى كل كلمة والعلاقات بينها. بالإضافة إلى ذلك، يتعلم LLM أيضًا كيفية التمييز بين الكلمات استنادًا إلى السياق. على سبيل المثال، تتعلم أن تفهم ما إذا كان "اليمين" يعني "الصحيح" أو هو مجرد "عكس اليسار".
الآن عملية الضبط الدقيق (ضبط دقيق(باللغة الإنجليزية) يهدف إلى "ضبط" برنامج الماجستير في القانون بدقة لأداء مهام محددة بكفاءة، مثل ترجمة النصوص، وتحسين أدائه. يعمل ضبط المطالبات (الأسئلة والتعليمات المقدمة إلى LLM) كنوع من الضبط الدقيق، حيث إنه قادر على تدريب النموذج لأداء مهمة معينة.
لكي يتمكن نموذج لغة كبير من أداء مهمة محددة، مثل الترجمة، فلا بد من ضبطه لهذه المهمة المحددة. يؤدي الضبط الدقيق إلى تحسين الأداء لمهام محددة.
يخدم الضبط الفوري وظيفة مماثلة للضبط الدقيق، وتدريب النموذج على أداء مهمة محددة من خلال مطالبات ذات عدد قليل من المحاولات، أو مطالبات بدون أي محاولة. فيما يلي مثال على تمرين "تحليل المشاعر" باستخدام مطالبة مكونة من بضع لقطات:
Texto de entrada: Essa casa é linda!
Sentimento da frase: Positivo
Texto de entrada: Essa casa é horrível!
Sentimento da frase: Negativo
وبناءً على النتائج التي تم الحصول عليها في هذا المثال، فإن LLM سوف يفهم، من خلال المعنى الدلالي لكلمة "فظيع" وبسبب تقديم مثال معاكس، أن مشاعر المستخدم في المثال الثاني "سلبية".
سيناريوهات الاستخدام
كما ذكرنا سابقًا، يمكن استخدام درجة الماجستير في القانون لأغراض عديدة:
- استرجاع المعلومات: وفي هذه الحالة يمكننا أن نتخيل استخدامه في محركات البحث على الويب، مثل Google أو Bing. عندما يستخدم المستخدم ميزة البحث في هذه الخدمات، فإنه يستخدم LLMs لإنتاج المعلومات في شكل استجابة لطلبه. يتمكن طلاب الماجستير في القانون من استرجاع المعلومات وتلخيصها وتوصيل الاستجابة في شكل محادثة مع المستخدم.
- إنشاء النصوص وأكواد البرمجة:تعتبر برامج الماجستير في القانون "المحرك" الرئيسي وراء الذكاء الاصطناعي التوليدي مثل ChatGPT، ويمكنها إنشاء نص ورمز برمجة استنادًا إلى المدخلات والمطالبات. على سبيل المثال، يتمتع chatGPT بالقدرة على فهم الأنماط ويمكنه الاستجابة بكفاءة لطلبات المستخدم مثل "كتابة قصيدة عن الزهور على طراز مانويل بانديرا" أو "كتابة كود بايثون قادر على فرز قائمة من الأفلام حسب الترتيب الأبجدي".
- روبوتات الدردشة والذكاء الاصطناعي المحادثة: أصبح بإمكان طلاب الماجستير في القانون بالفعل تقديم خدمة العملاء من خلال وكلاء الدردشة الآلية الذين يتحدثون مع المستهلكين، ويفسرون معنى أسئلتهم ومخاوفهم، ويقدمون إجابات أو إرشادات مناسبة.
بالإضافة إلى سيناريوهات الاستخدام هذه، أثبتت برامج الماجستير في القانون أنها أداة واعدة للذكاء الاصطناعي في مجالات التكنولوجيا والصحة والعلوم والتسويق والقانون وأيضًا للاستخدام في الأنظمة المصرفية. لإعطائك فكرة، يستطيع طلاب الماجستير في القانون حاليًا التنبؤ بدرجة عالية من الدقة حدوث سرطان الثدي تحليل مجموعات من عينات الخلايا بمستوى دقة أعلى من العديد من الأطباء ذوي الخبرة.

ماجستير في القانون والمحولات التوليدية المدربة مسبقًا (GPT)
O محولات أولية مدربة مسبقا (GPT) هو نوع محدد من LLM يستخدم بنية المحولات وتم تطويره بواسطة شركة OpenAI. تم تصميمه لفهم اللغة الطبيعية (مثل البرتغالية أو الإنجليزية) وتوليدها والتلاعب بها بطريقة فعالة وواقعية للغاية.
من خلال تحليل الاسم، يمكننا أن نفهم بشكل أفضل ما هو GPT:
- توليدي (مولد، بالبرتغالية): يشير إلى أن النموذج يولد نصًا، أي أنه قادر على إنتاج جمل جديدة وإجابات وملخصات ورموز وما إلى ذلك.
- مدرب مسبقًا (مدرب مسبقًا، باللغة البرتغالية): وهذا يعني أنه تم تدريبه مسبقًا على كمية كبيرة من النصوص من الإنترنت، مثل الكتب والمقالات ومواقع الويب وغيرها. ومن الممكن بعد ذلك تعديلها لمهام محددة.
- محول: كما ذكرنا سابقًا، هذه هي بنية الشبكة العصبية التي توفر الأساس للنموذج. إنه قابل للتوازي بدرجة كبيرة (يمكنه تنفيذ مهام متعددة في وقت واحد) وفعال في التعامل مع تسلسلات طويلة من النص.

الفرق الكبير بين GPT وبرامج الماجستير في القانون الأخرى هو مرحلة التدريب، والتي تتكون من 3 عمليات مختلفة:
- التدريب المسبق: يتم استخراج كميات هائلة من البيانات من الإنترنت والكتب وحتى مقاطع الفيديو والموسيقى، ثم تتم معالجتها وتحويلها إلى رموز.
- تعليمات الضبط الدقيق: هنا يتم "تعليم" النموذج كيفية الاستجابة لتعليمات محددة، ومواءمة استجاباته بحيث تكون أكثر دقة.
- التعلم التعزيزي من خلال التغذية الراجعة البشرية: على غرار الضبط الدقيق، هنا يتم "التدريس" من خلال ردود الفعل البشرية التي تحفز عملية "التعلم التعزيزي"، حيث يتعلم الذكاء الاصطناعي ما هو "صحيح" وما هو "خطأ" من خلال التكرارات والمعلومات التي يوفرها وكيل خارجي، في هذه الحالة، المستخدم الذي يستخدم الذكاء الاصطناعي.
التاريخ: من مليارات الكلمات إلى النصوص المعقدة
على الرغم من أن الطفرة في نماذج اللغة لم تحدث إلا في عام 2017، إلا أن نماذج المحاذاة الخاصة بشركة IBM كانت رائدة في مجال النمذجة اللغوية الإحصائية منذ عام 1990. في عام 2001، تمكن نموذج تم تدريبه على 3 ملايين كلمة من تحقيق "حالة من الفن" من حيث الدقة في تفسير النصوص وبناء الجمل المتماسكة.
من عام 2012 فصاعدا الشبكات العصبية اكتسبت أهمية أكبر في عالم الذكاء الاصطناعي وسرعان ما بدأت في استخدامها لمهام اللغة. في عام 2016، اعتمدت جوجل الترجمة الآلية العصبية (الترجمة الآلية العصبية، باللغة البرتغالية) باستخدام نماذج تعتمد على هذا المفهوم. في عام 2018، انخرطت شركة OpenAI في تطوير وكلاء الذكاء الاصطناعي استنادًا إلى LLMs وأطلقت GPT-1 للاختبار، وفي العام التالي فقط بدأ GPT-2 في جذب انتباه الجمهور بسبب استخداماته غير الأخلاقية المحتملة.
في عام 2020 GPT-3 لقد وصل ChatGPT (الوكيل الذكي المدعوم من GPT-2022) إلى السوق مع إمكانية وصول مقيدة فقط عبر واجهة برمجة التطبيقات (API)، ولكن في عام 3 فقط استحوذ ChatGPT (الوكيل الذكي "المدعوم" من GPT-XNUMX) على انتباه الجمهور في جميع أنحاء العالم.
ومن المقرر إطلاق GPT-4 في عام 2023 بقدرات متعددة الوسائط، على الرغم من عدم الكشف عن التفاصيل الفنية. في عام 2024، أطلقت OpenAI نموذج o1، مع التركيز على توليد سلاسل طويلة من التفكير. لقد أدت هذه الأدوات إلى اعتماد برامج الماجستير في القانون على نطاق واسع في مختلف مجالات البحث.
اعتبارًا من عام 2024، تعتمد جميع برامج الماجستير في القانون الأكبر والأكثر كفاءة على بنية المحول، مع قيام بعض الباحثين بالتجريب والاختبار باستخدام هياكل أخرى، مثل الشبكات العصبية المتكررة (الشبكات العصبية المتكررة، باللغة البرتغالية).
فوائد وقيود درجة الماجستير في القانون
بفضل مجموعة واسعة من التطبيقات، تعد درجة الماجستير في القانون مفيدة بشكل استثنائي في حل المشكلات لأنها توفر المعلومات بأسلوب واضح وبسيط يسهل على المستخدمين فهمه. بالإضافة إلى ذلك، يمكن استخدامها لترجمة اللغة، وإكمال الجمل، وتحليل المشاعر، والإجابة على الأسئلة، والمعادلات الرياضية، والمزيد.
يتحسن أداء برامج الماجستير في القانون باستمرار مع نموها وإضافة المزيد من البيانات والمعلمات. بمعنى آخر، كلما تعلمت أكثر، أصبحت أفضل. بالإضافة إلى ذلك، يمكن لنماذج اللغة الكبيرة أن تُظهر ما يسمى "التعلم في السياق". بمجرد تدريب LLM مسبقًا، يسمح الموجه المكون من عدة لقطات للنموذج بالتعلم من الموجه دون أي معلمات إضافية. بهذه الطريقة، فهو يتعلم بشكل مستمر.
من خلال إظهار التعلم في السياق، يتعلم طلاب الماجستير في القانون بسرعة لأنهم لا يحتاجون إلى وزن أو موارد أو معايير إضافية للتدريب. إنهم سريعون بمعنى أنهم لا يحتاجون إلى العديد من الأمثلة ليصبحوا أكثر "ذكاءً".

الميزة الأساسية لحاملي شهادات الماجستير في القانون هي قدرتهم على الرد على الاستفسارات غير المتوقعة. على سبيل المثال، يتلقى برنامج الكمبيوتر التقليدي الأوامر في صيغته المقبولة أو من مجموعة معينة من مدخلات المستخدم. من ناحية أخرى، يمكن لحامل شهادة الماجستير في القانون الاستجابة للغة البشرية الطبيعية واستخدام تحليل البيانات للإجابة على سؤال أو طلب غير منظم بطريقة منطقية. في حين أن برنامج الكمبيوتر النموذجي لن يتعرف على سؤال مثل "ما هي أعظم خمس فرق روك في التاريخ؟"، فإن طالب الماجستير في القانون قد يستجيب بقائمة تضم خمس فرق من هذا القبيل وحالة مقنعة إلى حد معقول لماذا هم الأفضل.
ومع ذلك، فيما يتعلق بالمعلومات التي تقدمها، لا يمكن لبرامج الماجستير في القانون أن تكون موثوقة إلا بقدر البيانات التي تتلقاها. إذا تلقوا معلومات خاطئة في مرحلة ما قبل التدريب، فسوف يقدمون معلومات خاطئة ردًا على استفسارات المستخدم. في بعض الأحيان، قد يصاب طلاب الماجستير في القانون بالهلوسة من خلال إنشاء إجابات وحتى مصادر أدبية مزيفة عندما لا يتمكنون من إنتاج إجابة دقيقة.
على سبيل المثال، في عام 2022، وكالة الأنباء نبذة عن الشركة سأل ChatGPT عن الربع المالي السابق للشركة تسلا. وعلى الرغم من أن موقع ChatGPT قدم مقالة إخبارية متماسكة ردًا على ذلك، إلا أن الكثير من المعلومات الواردة فيها كانت ملفقة. نظرًا لأنه نظام قائم على الذكاء الاصطناعي، فمن المعروف أنه يتحسن باستمرار، ولكن لا يزال من غير الصحيح الثقة بنسبة 100٪ في الاستجابات التي ينتجها طلاب الماجستير في القانون.
من حيث الأمان، فإن التطبيقات التي تواجه المستخدم والتي تعتمد على LLM معرضة للأخطاء مثل أي تطبيق آخر. يمكن أيضًا التلاعب بـ LLMs من خلال مدخلات ضارة لتوفير أنواع معينة من الاستجابات بدلاً من أنواع أخرى، بما في ذلك الاستجابات الخطيرة أو غير الأخلاقية.

وأخيرًا، إحدى مشكلات الأمان المتعلقة ببرامج الماجستير في القانون هي أن المستخدمين يمكنهم تحميل بيانات آمنة وسرية لزيادة إنتاجيتهم. لكن أنظمة إدارة التعلم الآلي تستخدم المدخلات التي تتلقاها لتدريب نماذجها بشكل أكبر، وهي غير مصممة لتكون خزائن آمنة، حيث يمكنها الكشف عن بيانات حساسة استجابة لاستفسارات من مستخدمين آخرين.
ماجستير القانون والذكاء وراء الكلمات
مثل طفل تم إطلاقه في مكتبة عملاقة، فإن برامج الماجستير في القانون هي أنظمة ذكاء اصطناعي ذكية تتعلم كيفية فهم اللغة البشرية الطبيعية وإعادة إنتاجها بناءً على كميات هائلة من البيانات. على الرغم من توفير العديد من الفوائد للمستخدمين العاديين وتصبح أداة مساعدة قوية في البيئة المهنية، إلا أن قدرات ومخاطر برامج الماجستير في القانون لا تزال بحاجة إلى دراسة دقيقة للغاية.
وأنت ما رأيك في الشرح الموجود في هذه المقالة حول الماجستير في القانون؟ اترك رأيك في التعليقات.
فيجا ميس
فونتيس: Elasticsearch, CloudFare, IBM
تمت مراجعته من قبل تياجو رودريغز في 16/04/2025
اكتشف المزيد عن Showmetech
قم بالتسجيل لتلقي آخر أخبارنا عبر البريد الإلكتروني.