وظائف بلس — مهندس تقييم وكيل مستقل
وظيفة منشورة على وظائف بلس، مع تفاصيل المتطلبات والمزايا ورابط التقديم المباشر.
مهندس تقييم وكيل مستقل
دوام عن بُعدتتقدّم باسم
زيارة موقع الشركةالإعلان الأصلي للوظيفة
Freelance Agent Evaluation Engineer Mindrift
مقارنة الرواتب
$40 – $40ثقة مرتفعة · $40/بالساعة – $40/بالساعة
الرواتب المعروضة تقديرية ومبنية على بيانات السوق المتاحة، وقد لا تعكس الراتب الفعلي للوظيفة.
الوصف
يرجى تقديم سيرتك الذاتية باللغة الإنجليزية وتحديد مستوى إتقانك للغة الإنجليزية. تربط Mindrift المتخصصين بفرص الذكاء الاصطناعي القائمة على المشاريع لشركات التكنولوجيا الرائدة، مع التركيز على اختبار أنظمة الذكاء الاصطناعي وتقييمها وتحسينها. المشاركة قائمة على المشروع، وليست توظيفًا دائمًا. ما تتضمنه هذه الفرصة نحن نبني مجموعة بيانات لتقييم وكلاء برمجة الذكاء الاصطناعي - مدى جودة تعامل النموذج مع مهام المطور في العالم الحقيقي. ستقوم بإنشاء مهام صعبة ومعايير تقييم ضمن بيئات محاكاة واقعية: - بناء شركات افتراضية باتباع خطة عالية المستوى - قاعدة بيانات، وبنية تحتية، وسياق (محادثات، وثائق، تذاكر) تشكل بيئة واقعية مع سجل تطوير - تجميع ومعايرة المهام من الحالات الوسيطة للشركة الافتراضية: صياغة المطالبة، وتحديد معايير التقييم، والتأكد من أن المهمة قابلة للحل وأن التقييم عادل - تصميم مهام يتم تعيينها في بيئات معزولة - محاكاة لمحطة عمل المطور: جهاز Linux مزود بأدوات تطوير (طرفية، CLI)، وخوادم MCP (مستودع، متتبع مهام، مراسلة، وثائق، إلخ)، وقاعدة بيانات تطبيق ويب حقيقية - كتابة اختبارات تقبل جميع الحلول الصحيحة وترفض الحلول غير الصحيحة - ليست صارمة جدًا (تتعطل عند الأساليب الصالحة) ولا متساهلة جدًا (تسمح بالأساليب السيئة) - التكرار مع وكيل الذكاء الاصطنائي في الاختبارات - التحقق من أنها تكتشف المشاكل الحقيقية، ولا تفوت الحلول السيئة، ولا تتعطل عند الحلول الجيدة - مراجعة التعليمات البرمجية المكتوبة بواسطة الوكلاء، وتحليل سبب فشل الوكيل أو نجاحه، وتصميم حالات الحافة والسيناريوهات العدائية - التكرار بناءً على ملاحظات من مراجعي ضمان الجودة الخبراء الذين يقومون بتقييم عملك بناءً على معايير الجودة ما هذا ليس ليس تسمية بيانات ليس هندسة مطالبات ليس كتابة تعليمات برمجية من البداية - يكتب الوكيل معظم التعليمات البرمجية؛ أنت توجه وتقيم يتم جزء كبير من العمل جنبًا إلى جنب مع الذكاء الاصطناعي - من الصعب جدًا إنشاء مهام تتحدى النماذج المتطورة دون استخدام النماذج المتطورة. ما نبحث عنه هذه الفرصة مناسبة للمطورين ذوي الخبرة ومهندسي البرمجيات و/أو المتخصصين في أتمتة الاختبارات المنفتحين على المشاريع بدوام جزئي وغير دائمة. من الناحية المثالية، سيتمتع المساهمون بما يلي: - درجة في علوم الكمبيوتر أو هندسة البرمجيات أو المجالات ذات الصلة - 5+ سنوات في تطوير البرمجيات، بشكل أساسي Python (FastAPI، pytest، async/await، subprocess، عمليات الملفات) - خلفية في تطوير الويب الكامل، مع خبرة في بناء واجهات قائمة على React (JavaScript/TypeScript) وأنظمة خلفية قوية - خبرة في كتابة الاختبارات (وظيفية، تكامل - ليس مجرد تشغيلها) - حاويات Docker، والإلمام بأدوات البنية التحتية (Postgres، Kafka، Redis) - فهم CI/CD (GitHub Actions كمستخدم: المشغلات، التسميات، قراءة النتائج) - إتقان اللغة الإنجليزية - B2 لا تحتاج إلى أن تكون خبيرًا في كل عنصر، ولكن يجب أن تكون مرتاحًا لقراءة التعليمات البرمجية والتفكير فيها عبر المكدس. لماذا هذا صعب النماذج المتطورة جيدة بالفعل في البرمجة. إنشاء مهمة تتحدى حقًا أفضل النماذج ليس بالأمر الهين. تحتاج إلى فهم عميق لأين تفشل النماذج وما هي السيناريوهات التي تكشف الفرق بين الحل الجيد والسيئ المهام لها العديد من الحلول الصالحة. كتابة اختبارات تقبل جميع الحلول الصحيحة وترفض الحلول غير الصحيحة أصعب مما تبدو عليه. كيف يعمل قدم → اجتياز المؤهلات → انضم إلى مشروع → أكمل المهام → احصل على أجر تقدير الجهد تقدر المهام لهذا المشروع بـ 20 ساعة لإكمالها، اعتمادًا على التعقيد. هذا تقدير وليس متطلبًا للجدول الزمني؛ أنت تختار متى وكيف تعمل. يجب تقديم المهام بحلول الموعد النهائي وتلبية معايير القبول المدرجة ليتم قبولها. التعويض في هذا المشروع، يمكن للمساهمين كسب ما يصل إلى 40 دولارًا في الساعة، اعتمادًا على مستواهم وسرعة مساهمتهم. تختلف التعويضات عبر المشاريع اعتمادًا على النطاق والتعقيد والخبرة المطلوبة. يرجى ملاحظة أن المشاريع الأخرى على المنصة قد تقدم مستويات ربح مختلفة بناءً على متطلباتها.
ما ستقوم به
- • ستقوم بإنشاء مهام صعبة ومعايير تقييم لوكلاء برمجة الذكاء الاصطناعي في بيئات محاكاة. يتضمن ذلك بناء شركات افتراضية، وتصميم المهام، والتكرار مع وكلاء الذكاء الاصطناعي لضمان التقييم الفعال.
المتطلبات
يجب أن يكون لدى المرشحين درجة في علوم الكمبيوتر أو المجالات ذات الصلة وخبرة لا تقل عن 5 سنوات في تطوير البرمجيات، بشكل أساسي في Python. مطلوب أيضًا الإلمام بتطوير الويب الكامل والاختبار.
التعليم المطلوب
- درجة البكالوريوس
نسبة التوافق18%
نصائح المقابلة
كن مستعدًا لمناقشة خبرتك في Python، وخاصة مع FastAPI، pytest، async/await، وsubprocess، حيث أن هذه المهارات أساسية للدور.
سلط الضوء على تجربتك في بناء واجهات React وأنظمة الواجهة الخلفية القوية، بالإضافة إلى خبرتك في كتابة اختبارات وظيفية وتكاملية.
استعرض فهمك لكيفية تقييم وتحدي نماذج الذكاء الاصطناعي المتطورة، وكيفية تصميم مهام تقييم فعالة.
أظهر قدرتك على العمل بشكل مستقل في بيئة قائمة على المشروع، مع الالتزام بالمواعيد النهائية ومعايير القبول.
اقتراح آلي للمسار الوظيفي، وليس توصية رسمية من صاحب العمل.
المسار الوظيفي
مهندس تعلم آلة
مهندس تقييم وكيل مستقل
مهندس اختبار أتمتة
مهندس برمجيات أول
الأسئلة الشائعة
ما هي طبيعة هذه الفرصة الوظيفية؟
هذه الفرصة قائمة على المشروع وليست توظيفًا دائمًا. تركز على اختبار وتقييم وتحسين أنظمة الذكاء الاصطناعي.
ما هي المهارات التقنية الأساسية المطلوبة؟
المهارات الأساسية تشمل Python (FastAPI, pytest, async/await, subprocess, عمليات الملفات)، تطوير الويب الكامل (React, JavaScript/TypeScript)، كتابة الاختبارات، Docker، وأدوات البنية التحتية مثل Postgres, Kafka, Redis، وفهم CI/CD.
كم يمكنني أن أكسب في هذا المشروع؟
يمكن للمساهمين كسب ما يصل إلى 40 دولارًا في الساعة، اعتمادًا على مستواهم وسرعة مساهمتهم.
هل هناك متطلبات للغة الإنجليزية؟
نعم، مطلوب إتقان اللغة الإنجليزية بمستوى B2.
ما هو تقدير الجهد المطلوب للمهام؟
تقدر المهام لهذا المشروع بـ 20 ساعة لإكمالها، ولكن هذا تقدير وليس متطلبًا للجدول الزمني؛ أنت تختار متى وكيف تعمل.
العمل في الرياض
تُعد الرياض، عاصمة المملكة العربية السعودية، مركزًا اقتصاديًا حيويًا يجذب المهنيين من مختلف أنحاء العالم. تتميز المدينة بسوق عمل ديناميكي يدعمه قطاعات رئيسية مثل النفط والغاز، التمويل، التكنولوجيا، والإنشاءات، مما يوفر فرصًا وظيفية متنوعة. تعكس ثقافة العمل في الرياض مزيجًا من التقاليد المحلية والمعايير الدولية، مع التركيز على الاحترافية والتفاني. يمكن للموظفين أن يتوقعوا بيئة عمل منظمة، حيث تُقدر العلاقات المهنية القوية. يمثل التنقل في الرياض جزءًا أساسيًا من الحياة اليومية، وتوفر المدينة خيارات سكنية متنوعة تناسب مختلف أنماط الحياة. غالبًا ما تبحث الشركات الكبرى، سواء كانت محلية أو عالمية، عن الكفاءات في الرياض، مما يساهم في تعزيز التنافسية والابتكار في سوق العمل.
موقع تجميع وظائف من جهات خارجية. الحقول المنظَّمة (المهام، المتطلبات، المزايا، التعليم، الراتب، الأسئلة) مُستنبَطة آلياً من الإعلان الأصلي وقد تكون غير دقيقة. يُرجى التحقّق عبر الموقع الرسمي لصاحب العمل قبل التقديم.