وظائف بلس — مهندس تقييم وكيل مستقل
وظيفة منشورة على وظائف بلس، مع تفاصيل المتطلبات والمزايا ورابط التقديم المباشر.
مايندريفت
مهندس تقييم وكيل مستقل
تتقدّم باسم
زيارة موقع الشركةالإعلان الأصلي للوظيفة
Freelance Agent Evaluation Engineer Mindrift
مقارنة الرواتب
$30 – $40ثقة مرتفعة · $30/بالساعة – $40/بالساعة
الرواتب المعروضة تقديرية ومبنية على بيانات السوق المتاحة، وقد لا تعكس الراتب الفعلي للوظيفة.
الوصف
يرجى تقديم سيرتك الذاتية باللغة الإنجليزية وتحديد مستوى إتقانك للغة الإنجليزية. تربط Mindrift المتخصصين بفرص الذكاء الاصطناعي القائمة على المشاريع لشركات التكنولوجيا الرائدة، مع التركيز على اختبار أنظمة الذكاء الاصطناعي وتقييمها وتحسينها. المشاركة قائمة على المشاريع، وليست توظيفًا دائمًا. ما تتضمنه هذه الفرصة نحن نبني مجموعة بيانات لتقييم وكلاء برمجة الذكاء الاصطناعي - مدى جودة تعامل النموذج مع مهام المطور في العالم الحقيقي. ستقوم بإنشاء مهام صعبة ومعايير تقييم ضمن بيئات محاكاة واقعية: - بناء شركات افتراضية باتباع خطة عالية المستوى - قاعدة بيانات، وبنية تحتية، وسياق (محادثات، وثائق، تذاكر) تشكل بيئة واقعية مع سجل تطوير - تجميع ومعايرة المهام من الحالات الوسيطة للشركة الافتراضية: صياغة المطالبة، وتحديد معايير التقييم، والتأكد من أن المهمة قابلة للحل وأن التقييم عادل - تصميم مهام في بيئات معزولة - محاكاة لمحطة عمل المطور: جهاز Linux مزود بأدوات التطوير (طرفية، CLI)، وخوادم MCP (مستودع، ومتتبع المهام، ومرسال، ووثائق، وما إلى ذلك)، وقاعدة بيانات تطبيق ويب حقيقية - كتابة اختبارات تقبل جميع الحلول الصحيحة وترفض الحلول غير الصحيحة - ليست صارمة جدًا (تتعطل عند الأساليب الصالحة) ولا متساهلة جدًا (تمرر الحلول السيئة) - التكرار مع وكيل الذكاء الاصطناعي في الاختبارات - التحقق من أنها تلتقط المشكلات الحقيقية، ولا تفوت الحلول السيئة، ولا تتعطل عند الحلول الجيدة - مراجعة التعليمات البرمجية المكتوبة بواسطة الوكلاء، وتحليل سبب فشل الوكيل أو نجاحه، وتصميم حالات الحافة والسيناريوهات العدائية - التكرار بناءً على ملاحظات من مراجعي ضمان الجودة الخبراء الذين يقومون بتقييم عملك بناءً على معايير الجودة ما هذا ليس - ليس تسمية بيانات - ليس هندسة مطالبات - ليس كتابة تعليمات برمجية من البداية - يكتب الوكيل معظم التعليمات البرمجية؛ أنت توجه وتقيم جزء كبير من العمل يتم بالتعاون مع الذكاء الاصطناعي - من الصعب جدًا إنشاء مهام تتحدى النماذج الرائدة دون استخدام النماذج الرائدة. ما نبحث عنه هذه الفرصة مناسبة للمطورين ذوي الخبرة ومهندسي البرمجيات و/أو المتخصصين في أتمتة الاختبارات المنفتحين على المشاريع بدوام جزئي وغير دائمة. من الناحية المثالية، سيتمتع المساهمون بما يلي: - درجة في علوم الكمبيوتر أو هندسة البرمجيات أو المجالات ذات الصلة - 5+ سنوات في تطوير البرمجيات، بشكل أساسي Python (FastAPI، pytest، async/await، subprocess، عمليات الملفات) - خلفية في تطوير الويب الكامل، مع خبرة في بناء واجهات قائمة على React (JavaScript/TypeScript) وأنظمة خلفية قوية - خبرة في كتابة الاختبارات (وظيفية، تكامل - ليس فقط تشغيلها) - حاويات Docker، والإلمام بأدوات البنية التحتية (Postgres، Kafka، Redis) - فهم CI/CD (GitHub Actions كمستخدم: المشغلات، التسميات، قراءة النتائج) - إتقان اللغة الإنجليزية - B2 لا تحتاج إلى أن تكون خبيرًا في كل عنصر، ولكن يجب أن تكون مرتاحًا لقراءة التعليمات البرمجية والتعليل عنها عبر المكدس. لماذا هذا صعب النماذج الرائدة جيدة بالفعل في البرمجة. إنشاء مهمة تتحدى حقًا أفضل النماذج ليس بالأمر الهين. تحتاج إلى فهم عميق لأين تفشل النماذج وما هي السيناريوهات التي تكشف الفرق بين الحل الجيد والحل السيئ. المهام لها العديد من الحلول الصالحة. كتابة اختبارات تقبل جميع الحلول الصحيحة وترفض الحلول غير الصحيحة أصعب مما يبدو. كيف يعمل تقديم → اجتياز المؤهلات → الانضمام إلى مشروع → إكمال المهام → الحصول على الأجر تقدير الجهد يُقدر أن تستغرق مهام هذا المشروع 20 ساعة لإكمالها، اعتمادًا على التعقيد. هذا تقدير وليس متطلبًا للجدول الزمني؛ أنت تختار متى وكيف تعمل. يجب تقديم المهام بحلول الموعد النهائي وتلبية معايير القبول المذكورة ليتم قبولها. التعويض في هذا المشروع، يمكن للمساهمين كسب ما يصل إلى 40 دولارًا في الساعة، اعتمادًا على مستواهم وسرعة مساهمتهم. يختلف التعويض عبر المشاريع اعتمادًا على النطاق والتعقيد والخبرة المطلوبة. يرجى ملاحظة أن المشاريع الأخرى على المنصة قد تقدم مستويات ربح مختلفة بناءً على متطلباتها.
ما ستقوم به
- • ستقوم بتصميم وتقييم مهام صعبة لوكلاء برمجة الذكاء الاصطناعي ضمن بيئات المطورين المحاكاة. يتضمن ذلك كتابة اختبارات وظيفية، وتحليل أداء الوكيل، والتكرار على السيناريوهات بناءً على ملاحظات الخبراء.
المتطلبات
يجب أن يكون لدى المرشحين خبرة لا تقل عن 5 سنوات في تطوير البرمجيات مع إتقان قوي للغة Python وتقنيات الويب الكامل. مطلوب درجة علمية في علوم الكمبيوتر أو مجال ذي صلة، بالإضافة إلى الخبرة في أتمتة الاختبارات وأدوات البنية التحتية.
التعليم المطلوب
- درجة البكالوريوس
نسبة التوافق50%
نصائح المقابلة
استعرض خبرتك في تطوير البرمجيات باستخدام Python، مع التركيز على FastAPI وpytest، وكيف يمكنك تطبيقها في تقييم وكلاء الذكاء الاصطناعي.
ناقش فهمك لكيفية عمل نماذج الذكاء الاصطناعي في البرمجة، وقدرتك على تصميم مهام تتحدى هذه النماذج وتكشف عن نقاط ضعفها.
كن مستعدًا لمناقشة خبرتك في بناء بيئات محاكاة، وكتابة اختبارات وظيفية وتكاملية، وتحليل أداء التعليمات البرمجية.
أظهر قدرتك على العمل بشكل مستقل في بيئة قائمة على المشاريع، مع الالتزام بالمواعيد النهائية ومعايير القبول.
اقتراح آلي للمسار الوظيفي، وليس توصية رسمية من صاحب العمل.
المسار الوظيفي
مهندس اختبار أتمتة متقدم
مهندس تقييم وكيل مستقل
مهندس تعلم آلة
مهندس جودة برمجيات
الأسئلة الشائعة
ما هي طبيعة العمل في Mindrift؟
تربط Mindrift المتخصصين بفرص الذكاء الاصطناعي القائمة على المشاريع لشركات التكنولوجيا الرائدة، مع التركيز على اختبار أنظمة الذكاء الاصطناعي وتقييمها وتحسينها. المشاركة قائمة على المشاريع، وليست توظيفًا دائمًا.
ما هو الدور الرئيسي لمهندس تقييم الوكيل؟
الدور الرئيسي هو بناء مجموعة بيانات لتقييم وكلاء برمجة الذكاء الاصطناعي، وإنشاء مهام صعبة ومعايير تقييم ضمن بيئات محاكاة واقعية، وكتابة اختبارات، ومراجعة التعليمات البرمجية المكتوبة بواسطة الوكلاء، وتحليل أدائهم.
ما هي الخبرة المطلوبة لهذه الفرصة؟
نبحث عن مطورين ذوي خبرة، ومهندسي برمجيات، و/أو متخصصين في أتمتة الاختبارات. يفضل أن يكون لدى المساهمين درجة في علوم الكمبيوتر أو هندسة البرمجيات، و5+ سنوات في تطوير البرمجيات (خاصة Python)، وخلفية في تطوير الويب الكامل، وخبرة في كتابة الاختبارات، والإلمام بحاويات Docker وأدوات البنية التحتية، وفهم CI/CD، وإتقان اللغة الإنجليزية بمستوى B2.
كم يمكنني أن أكسب في هذا المشروع؟
في هذا المشروع، يمكن للمساهمين كسب ما يصل إلى 40 دولارًا في الساعة، اعتمادًا على مستواهم وسرعة مساهمتهم. يختلف التعويض عبر المشاريع اعتمادًا على النطاق والتعقيد والخبرة المطلوبة.
هل هذا العمل بدوام كامل؟
لا، هذه الفرصة مناسبة للمشاريع بدوام جزئي وغير دائمة. المشاركة قائمة على المشاريع، وليست توظيفًا دائمًا.
العمل في مدينة الكويت
تُعد مدينة الكويت مركزًا اقتصاديًا حيويًا في منطقة الخليج، وتتميز بسوق عمل ديناميكي يجذب المواهب من مختلف أنحاء العالم. تهيمن على اقتصاد المدينة قطاعات النفط والغاز، التمويل، الخدمات المصرفية، والإنشاءات، بالإضافة إلى نمو ملحوظ في قطاعات التكنولوجيا والضيافة. تتميز بيئة العمل في الكويت بكونها متعددة الثقافات، حيث يعمل الكويتيون جنبًا إلى جنب مع المغتربين، مما يخلق تبادلًا للخبرات ووجهات النظر. غالبًا ما تُقدر العلاقات الشخصية والشبكات المهنية في بيئة العمل الكويتية. تتسم ثقافة العمل بالاحترام والالتزام بالتقاليد، مع تزايد الانفتاح على الابتكار والتطور. يمكن للمحترفين الطموحين أن يجدوا فرصًا واعدة للنمو الوظيفي في هذه المدينة المزدهرة، حيث تسعى الشركات الكبرى والصغرى على حد سواء إلى استقطاب الكفاءات لتعزيز مكانتها في السوق الإقليمي.
موقع تجميع وظائف من جهات خارجية. الحقول المنظَّمة (المهام، المتطلبات، المزايا، التعليم، الراتب، الأسئلة) مُستنبَطة آلياً من الإعلان الأصلي وقد تكون غير دقيقة. يُرجى التحقّق عبر الموقع الرسمي لصاحب العمل قبل التقديم.