وظائف بلس — مهندس بايثون أول لاستخراج البيانات (مستقل)
وظيفة منشورة على وظائف بلس، مع تفاصيل المتطلبات والمزايا ورابط التقديم المباشر.
مهندس بايثون أول لاستخراج البيانات (مستقل)
تتقدّم باسم
زيارة موقع الشركةالإعلان الأصلي للوظيفة
Senior Python Data Scraping Engineer (Freelance) Mindrift
مقارنة الرواتب
$37 – $37ثقة مرتفعة · $37/بالساعة – $37/بالساعة
الرواتب المعروضة تقديرية ومبنية على بيانات السوق المتاحة، وقد لا تعكس الراتب الفعلي للوظيفة.
الوصف
تبحث Mindrift عن مهندسي بايثون أول لاستخراج البيانات ذوي مهارات عالية للانضمام إلى مشروع Tendem وقيادة سير عمل استخراج البيانات المتخصص ضمن نظامنا الهجين للذكاء الاصطناعي والبشر. في هذا الدور، بصفتك طيارًا للذكاء الاصطناعي – هكذا نشير إلى هذا الدور في Mindrift – ستتعاون مع وكلاء Tendem الذين يتعاملون مع المهام المتكررة، بينما تقدم أنت التفكير النقدي والخبرة المتخصصة ومراقبة الجودة لتقديم نتائج دقيقة وقابلة للتنفيذ. تعتبر هذه الفرصة للعمل عن بعد بدوام جزئي مثالية للمحترفين التقنيين ذوي الخبرة العملية في استخراج البيانات من الويب ومعالجتها. ماذا نفعل تربط منصة Mindrift المتخصصين بمشاريع الذكاء الاصطناعي من كبار المبتكرين في مجال التكنولوجيا. مهمتنا هي إطلاق العنان لإمكانات الذكاء الاصطناعي التوليدي من خلال الاستفادة من الخبرة الواقعية من جميع أنحاء العالم. هذا دور مستقل لمشروع Tendem. بصفتك مهندس بايثون أول لاستخراج البيانات، ستتعامل مع مهام استخراج البيانات التي تتطلب دقة تقنية لاستخراج ومعالجة الويب، باستخدام أدوات متنوعة مثل Apify و OpenRouter المقدمة لدينا بالإضافة إلى أساليبك المبتكرة الخاصة. المسؤوليات الرئيسية: امتلاك سير عمل استخراج البيانات الشامل من البداية إلى النهاية عبر مواقع الويب المعقدة، مما يضمن التغطية الكاملة والدقة والتسليم الموثوق به لمجموعات البيانات المنظمة. الاستفادة من الأدوات الداخلية (Apify, OpenRouter) جنبًا إلى جنب مع سير العمل المخصص لتسريع جمع البيانات والتحقق من صحتها وتنفيذ المهام مع تلبية المتطلبات المحددة. ضمان الاستخراج الموثوق به من مصادر الويب الديناميكية والتفاعلية، وتكييف الأساليب حسب الحاجة للتعامل مع المحتوى المعروض بواسطة JavaScript وتغيير سلوك الموقع. فرض معايير جودة البيانات من خلال فحوصات التحقق من الصحة، وضوابط الاتساق عبر المصادر، والالتزام بمواصفات التنسيق، والتحقق المنهجي قبل التسليم. توسيع نطاق عمليات الاستخراج لمجموعات البيانات الكبيرة باستخدام التجميع الفعال أو الموازاة، ومراقبة الأعطال، والحفاظ على الاستقرار ضد التغييرات الطفيفة في هيكل الموقع. المتطلبات: خبرة لا تقل عن 5 سنوات في هندسة البيانات، استخراج الويب، الأتمتة، أو تطوير البرمجيات (مطلوب). درجة البكالوريوس أو الماجستير في الهندسة، الرياضيات التطبيقية، علوم الكمبيوتر، أو المجالات التقنية ذات الصلة هي ميزة إضافية. يجب أن يتمتع المرشحون بأساس تقني قوي وخبرة عملية في البرمجة النصية، الأتمتة، وسير العمل المدعومة بالذكاء الاصطناعي. نحن نبحث عن متخصصين يمكنهم حل المشكلات غير البسيطة، والعمل بثقة مع نماذج اللغة الكبيرة (LLMs)، وجمع البيانات وهيكلتها والتحقق من صحتها بشكل منهجي من مصادر متنوعة. يعد النهج المنهجي والدقيق والقدرة على العمل بشكل مستقل أمرًا ضروريًا. خبرة قوية في استخراج الويب باستخدام بايثون (BeautifulSoup, Selenium أو ما شابه)، بما في ذلك المحتوى الديناميكي (JS, AJAX, infinite scroll) وواجهات برمجة التطبيقات عبر الوكلاء. قدرة مثبتة على استخراج البيانات من الهياكل المعقدة (التسلسلات الهرمية، الصفحات المؤرشفة، HTML غير المتناسق). خلفية قوية في تنظيف البيانات، وتوحيدها، والتحقق من صحتها، وتقديم مجموعات بيانات منظمة (CSV, JSON, Google Sheets). خبرة مثبتة في التعامل مع آليات مكافحة الروبوتات وهياكل المواقع الديناميكية على نطاق واسع. خبرة في البنية التحتية السحابية (AWS أو ما يعادلها) والحاويات (Docker) كجزء من سير العمل الحقيقية. خبرة عملية مع أطر عمل نماذج اللغة الكبيرة (LangChain, OpenRouter, أو ما شابه) المطبقة على مهام الأتمتة. اهتمام قوي بالتفاصيل والالتزام بدقة البيانات. أخلاقيات عمل موجهة ذاتيًا مع القدرة على استكشاف الأخطاء وإصلاحها بشكل مستقل. رابط إلى GitHub هو ميزة إضافية. إتقان اللغة الإنجليزية: مستوى متوسط علوي (B2) أو أعلى (مطلوب). توقعات وقت المشروع بالنسبة لهذا المشروع، يُقدر أن المهام تتطلب حوالي 10-20 ساعة في الأسبوع خلال المراحل النشطة، بناءً على متطلبات المشروع. هذا تقدير، وليس عبء عمل مضمون، وينطبق فقط أثناء نشاط المشروع. التعويض في هذا المشروع، يمكن للمساهمين كسب ما يصل إلى 37 دولارًا في الساعة، اعتمادًا على مستواهم وسرعة مساهمتهم. يختلف التعويض عبر المشاريع اعتمادًا على النطاق والتعقيد والخبرة المطلوبة. يرجى ملاحظة أن المشاريع الأخرى على المنصة قد تقدم مستويات ربح مختلفة بناءً على متطلباتها.
ما ستقوم به
- • امتلاك سير عمل استخراج البيانات الشامل من مواقع الويب المعقدة لتقديم مجموعات بيانات منظمة. استخدم أدوات مثل Apify و OpenRouter لتوسيع نطاق عمليات الاستخراج وضمان معايير عالية لجودة البيانات.
المتطلبات
يتطلب 5 سنوات على الأقل من الخبرة في هندسة البيانات أو استخراج الويب مع إتقان قوي للغة بايثون والتعامل مع المحتوى الديناميكي. يجب أن يكون المرشحون ذوي خبرة في أطر عمل نماذج اللغة الكبيرة (LLM)، والبنية التحتية السحابية، وآليات مكافحة الروبوتات.
التعليم المطلوب
- - درجة البكالوريوس
- - درجة الدراسات العليا
نسبة التوافق13%
نصائح المقابلة
كن مستعدًا لمناقشة خبرتك الواسعة في استخراج البيانات باستخدام Python، مع التركيز على BeautifulSoup و Selenium، وكيف تعاملت مع المحتوى الديناميكي وآليات مكافحة الروبوتات.
سلط الضوء على قدرتك على العمل بشكل مستقل وحل المشكلات غير البسيطة، وقدم أمثلة على مشاريع سابقة أظهرت فيها هذه المهارات.
اشرح كيف يمكنك دمج أدوات مثل Apify و OpenRouter في سير عمل استخراج البيانات، وكيف تستخدم نماذج اللغة الكبيرة (LLMs) في مهام الأتمتة.
استعرض اهتمامك بالتفاصيل والتزامك بدقة البيانات، وقدم أمثلة على كيفية ضمان جودة البيانات في مشاريعك السابقة.
اقتراح آلي للمسار الوظيفي، وليس توصية رسمية من صاحب العمل.
المسار الوظيفي
مهندس بيانات رئيسي
مهندس بايثون أول لاستخراج البيانات (مستقل)
مهندس تعلم آلة
مهندس حلول تقنية
الأسئلة الشائعة
ما هو الدور الذي تبحث عنه Mindrift؟
تبحث Mindrift عن مهندس بايثون أول لاستخراج البيانات (مستقل) للانضمام إلى مشروع Tendem وقيادة سير عمل استخراج البيانات المتخصص.
ما هي طبيعة العمل في هذا الدور؟
هذا دور مستقل بدوام جزئي عن بعد، حيث ستعمل كطيار للذكاء الاصطناعي وتتعاون مع وكلاء Tendem، وتقدم التفكير النقدي والخبرة المتخصصة ومراقبة الجودة.
ما هي الأدوات والتقنيات الرئيسية المطلوبة؟
المهارات المطلوبة تشمل Python، استخراج الويب (BeautifulSoup, Selenium)، استخراج البيانات، والخبرة في أدوات مثل Apify و OpenRouter، بالإضافة إلى أطر عمل نماذج اللغة الكبيرة (LLMs) والبنية التحتية السحابية.
ما هي الخبرة المطلوبة لهذا الدور؟
مطلوب خبرة لا تقل عن 5 سنوات في هندسة البيانات، استخراج الويب، الأتمتة، أو تطوير البرمجيات، بالإضافة إلى إتقان اللغة الإنجليزية (مستوى B2 أو أعلى).
كم ساعة عمل متوقعة في الأسبوع؟
بالنسبة لهذا المشروع، تُقدر المهام بحوالي 10-20 ساعة في الأسبوع خلال المراحل النشطة، وهذا تقدير وليس عبء عمل مضمون.
ما هو التعويض المتوقع لهذا الدور؟
يمكن للمساهمين كسب ما يصل إلى 37 دولارًا في الساعة، اعتمادًا على مستواهم وسرعة مساهمتهم.
العمل في المنامة
تُعد المنامة، عاصمة البحرين، مركزًا اقتصاديًا حيويًا في منطقة الخليج العربي، وتوفر بيئة عمل ديناميكية وجذابة للمهنيين من مختلف التخصصات. تشتهر المدينة بقطاعها المالي والمصرفي المتطور، بالإضافة إلى قطاعات الخدمات، التجزئة، والضيافة التي تشهد نموًا مستمرًا. يتميز سوق العمل في المنامة بتنوعه، حيث تستقطب الشركات المحلية والعالمية المواهب من داخل البحرين وخارجها. الثقافة العملية في المنامة تمزج بين القيم التقليدية والتوجهات الحديثة، مع التركيز على الكفاءة المهنية والتعاون. التنقل داخل المدينة مريح نسبيًا، وتوفر المنامة أسلوب حياة عصريًا مع مجموعة واسعة من خيارات السكن والترفيه، مما يجعلها وجهة مفضلة للكثيرين الذين يسعون إلى فرص وظيفية واعدة في منطقة الخليج.
موقع تجميع وظائف من جهات خارجية. الحقول المنظَّمة (المهام، المتطلبات، المزايا، التعليم، الراتب، الأسئلة) مُستنبَطة آلياً من الإعلان الأصلي وقد تكون غير دقيقة. يُرجى التحقّق عبر الموقع الرسمي لصاحب العمل قبل التقديم.