وظائف بلس — مهندس بايثون أول لجمع البيانات (مستقل)
وظيفة منشورة على وظائف بلس، مع تفاصيل المتطلبات والمزايا ورابط التقديم المباشر.
مهندس بايثون أول لجمع البيانات (مستقل)
تتقدّم باسم
زيارة موقع الشركةالإعلان الأصلي للوظيفة
Senior Python Data Scraping Engineer (Freelance) Mindrift
مقارنة الرواتب
$37 – $37ثقة مرتفعة · $37/بالساعة – $37/بالساعة
الرواتب المعروضة تقديرية ومبنية على بيانات السوق المتاحة، وقد لا تعكس الراتب الفعلي للوظيفة.
الوصف
تبحث Mindrift عن مهندسي بايثون أول لجمع البيانات ذوي مهارات عالية للانضمام إلى مشروع Tendem وقيادة سير عمل جمع البيانات المتخصص ضمن نظامنا الهجين الذي يجمع بين الذكاء الاصطناعي والعنصر البشري. في هذا الدور، بصفتك طيارًا للذكاء الاصطناعي – هكذا نشير إلى هذا الدور في Mindrift – ستتعاون مع وكلاء Tendem الذين يتعاملون مع المهام المتكررة، بينما تقدم أنت التفكير النقدي والخبرة في المجال ومراقبة الجودة لتقديم نتائج دقيقة وقابلة للتنفيذ. تعد هذه الفرصة عن بعد بدوام جزئي مثالية للمحترفين التقنيين ذوي الخبرة العملية في جمع البيانات من الويب واستخراجها ومعالجتها. ماذا نفعل تربط منصة Mindrift المتخصصين بمشاريع الذكاء الاصطناعي من كبار المبتكرين في مجال التكنولوجيا. مهمتنا هي إطلاق العنان لإمكانات الذكاء الاصطناعي التوليدي من خلال الاستفادة من الخبرة الواقعية من جميع أنحاء العالم. هذا دور مستقل لمشروع Tendem. بصفتك مهندس بايثون أول لجمع البيانات، ستتعامل مع مهام جمع البيانات التي تتطلب دقة تقنية لاستخراج ومعالجة الويب، باستخدام أدوات متنوعة مثل Apify و OpenRouter المقدمة من قبلنا بالإضافة إلى أساليبك المبتكرة الخاصة. المسؤوليات الرئيسية: - امتلاك سير عمل استخراج البيانات الشامل من البداية إلى النهاية عبر مواقع الويب المعقدة، مما يضمن التغطية الكاملة والدقة والتسليم الموثوق به لمجموعات البيانات المنظمة. - الاستفادة من الأدوات الداخلية (Apify, OpenRouter) جنبًا إلى جنب مع سير العمل المخصص لتسريع جمع البيانات والتحقق من صحتها وتنفيذ المهام مع تلبية المتطلبات المحددة. - ضمان الاستخراج الموثوق به من مصادر الويب الديناميكية والتفاعلية، وتكييف الأساليب حسب الحاجة للتعامل مع المحتوى المعروض بواسطة JavaScript وتغيير سلوك الموقع. - فرض معايير جودة البيانات من خلال فحوصات التحقق من الصحة، وضوابط الاتساق عبر المصادر، والالتزام بمواصفات التنسيق، والتحقق المنهجي قبل التسليم. - توسيع نطاق عمليات جمع البيانات لمجموعات البيانات الكبيرة باستخدام التجميع الفعال أو الموازاة، ومراقبة الأعطال، والحفاظ على الاستقرار ضد التغييرات الطفيفة في هيكل الموقع. المتطلبات: - 5 سنوات على الأقل من الخبرة ذات الصلة في هندسة البيانات، أو جمع البيانات من الويب، أو الأتمتة، أو تطوير البرمجيات (مطلوب). - درجة البكالوريوس أو الماجستير في الهندسة، أو الرياضيات التطبيقية، أو علوم الكمبيوتر، أو المجالات التقنية ذات الصلة هي ميزة إضافية. - يجب أن يتمتع المرشحون بأساس تقني قوي وخبرة عملية في البرمجة النصية والأتمتة وسير العمل المدعوم بالذكاء الاصطناعي. نحن نبحث عن متخصصين يمكنهم حل المشكلات غير البسيطة، والعمل بثقة مع نماذج اللغة الكبيرة (LLMs)، وجمع البيانات وتنظيمها والتحقق من صحتها بشكل منهجي من مصادر متنوعة. يعد النهج المنهجي والدقيق والقدرة على العمل بشكل مستقل أمرًا ضروريًا. - خبرة قوية في جمع البيانات من الويب باستخدام بايثون (BeautifulSoup، Selenium أو ما شابه)، بما في ذلك المحتوى الديناميكي (JS، AJAX، التمرير اللانهائي) وواجهات برمجة التطبيقات عبر الوكلاء. - قدرة مثبتة على استخراج البيانات من الهياكل المعقدة (التسلسلات الهرمية، الصفحات المؤرشفة، HTML غير المتناسق). - خلفية قوية في تنظيف البيانات وتوحيدها والتحقق من صحتها، وتقديم مجموعات بيانات منظمة (CSV، JSON، Google Sheets). - خبرة مثبتة في التعامل مع آليات مكافحة الروبوتات وهياكل المواقع الديناميكية على نطاق واسع. - خبرة في البنية التحتية السحابية (AWS أو ما يعادلها) والحاويات (Docker) كجزء من سير العمل الحقيقي. - خبرة عملية في أطر عمل نماذج اللغة الكبيرة (LangChain، OpenRouter، أو ما شابه) المطبقة على مهام الأتمتة. - اهتمام قوي بالتفاصيل والالتزام بدقة البيانات. - أخلاقيات عمل موجهة ذاتيًا مع القدرة على استكشاف الأخطاء وإصلاحها بشكل مستقل. - رابط إلى GitHub هو ميزة إضافية. - إتقان اللغة الإنجليزية: مستوى فوق المتوسط (B2) أو أعلى (مطلوب). توقعات وقت المشروع بالنسبة لهذا المشروع، يُقدر أن المهام تتطلب حوالي 10-20 ساعة في الأسبوع خلال المراحل النشطة، بناءً على متطلبات المشروع. هذا تقدير، وليس عبء عمل مضمون، وينطبق فقط أثناء نشاط المشروع. التعويض في هذا المشروع، يمكن للمساهمين كسب ما يصل إلى 37 دولارًا في الساعة، اعتمادًا على مستواهم وسرعة مساهمتهم. يختلف التعويض عبر المشاريع اعتمادًا على النطاق والتعقيد والخبرة المطلوبة. يرجى ملاحظة أن المشاريع الأخرى على المنصة قد تقدم مستويات أرباح مختلفة بناءً على متطلباتها.
ما ستقوم به
- • امتلاك سير عمل استخراج البيانات الشامل من مواقع الويب المعقدة لتقديم مجموعات بيانات دقيقة ومنظمة. استخدام الأدوات الداخلية وسكربتات بايثون المخصصة للتعامل مع المحتوى الديناميكي وتوسيع نطاق عمليات جمع البيانات.
المتطلبات
يتطلب 5 سنوات على الأقل من الخبرة في هندسة البيانات أو جمع البيانات من الويب مع إتقان بايثون والتعامل مع آليات مكافحة الروبوتات. يجب أن يكون المرشحون مرتاحين للعمل مع نماذج اللغة الكبيرة (LLMs) ولديهم خلفية قوية في توحيد البيانات.
التعليم المطلوب
- درجة البكالوريوس
- درجة الدراسات العليا
نسبة التوافق13%
نصائح المقابلة
استعد لمناقشة خبرتك الواسعة في جمع البيانات من الويب باستخدام Python، مع التركيز على BeautifulSoup و Selenium، وكيف تعاملت مع المحتوى الديناميكي وآليات مكافحة الروبوتات.
كن مستعدًا لعرض قدرتك على حل المشكلات المعقدة والعمل بشكل مستقل، حيث أن هذا الدور يتطلب التفكير النقدي والخبرة في المجال.
سلط الضوء على تجربتك في العمل مع نماذج اللغة الكبيرة (LLMs) وأطر عملها مثل LangChain أو OpenRouter، وكيف قمت بتطبيقها على مهام الأتمتة.
ناقش كيفية ضمان جودة البيانات ودقتها في مشاريع جمع البيانات السابقة، مع التركيز على التحقق من الصحة والتوحيد القياسي.
اقتراح آلي للمسار الوظيفي، وليس توصية رسمية من صاحب العمل.
المسار الوظيفي
مهندس بيانات أول
مهندس بايثون أول لجمع البيانات (مستقل)
مهندس تعلم آلة
مهندس حلول بيانات
الأسئلة الشائعة
ما هو الدور الوظيفي؟
الدور هو مهندس بايثون أول لجمع البيانات (مستقل) في مشروع Tendem، حيث ستعمل كطيار للذكاء الاصطناعي وتتعاون مع وكلاء Tendem للتعامل مع مهام جمع البيانات المتخصصة.
ما هي الشركة التي تقدم هذه الفرصة؟
الشركة هي Mindrift، وهي منصة تربط المتخصصين بمشاريع الذكاء الاصطناعي من كبار المبتكرين في مجال التكنولوجيا.
ما هي الخبرة المطلوبة لهذا الدور؟
مطلوب 5 سنوات على الأقل من الخبرة ذات الصلة في هندسة البيانات، أو جمع البيانات من الويب، أو الأتمتة، أو تطوير البرمجيات. درجة البكالوريوس أو الماجستير في المجالات التقنية ذات الصلة هي ميزة إضافية.
ما هي الأدوات والتقنيات التي يجب أن يكون لدي خبرة بها؟
يجب أن تكون لديك خبرة قوية في جمع البيانات من الويب باستخدام بايثون (BeautifulSoup، Selenium أو ما شابه)، والتعامل مع المحتوى الديناميكي وواجهات برمجة التطبيقات، بالإضافة إلى الخبرة في أطر عمل نماذج اللغة الكبيرة (LLMs) مثل LangChain أو OpenRouter.
ما هو نوع العمل وساعات العمل المتوقعة؟
هذه فرصة مستقلة عن بعد بدوام جزئي. يُقدر أن المهام تتطلب حوالي 10-20 ساعة في الأسبوع خلال المراحل النشطة للمشروع.
ما هو التعويض المتوقع لهذا الدور؟
يمكن للمساهمين كسب ما يصل إلى 37 دولارًا في الساعة، اعتمادًا على مستواهم وسرعة مساهمتهم.
العمل في دبي
تُعد دبي مركزًا عالميًا للأعمال، وتجذب المهنيين الطموحين من جميع أنحاء العالم. تتميز المدينة بسوق عمل ديناميكي يضم مجموعة واسعة من الصناعات المزدهرة، بما في ذلك التمويل والتكنولوجيا والضيافة والعقارات. تشتهر دبي بثقافتها العملية سريعة الوتيرة والموجهة نحو النتائج، حيث يتم تقدير الابتكار والتميز. غالبًا ما توفر الشركات في دبي بيئة عمل متعددة الثقافات، مما يعكس التنوع السكاني في المدينة. تساهم البنية التحتية الحديثة في دبي، بما في ذلك شبكة النقل العام الفعالة، في تسهيل التنقل اليومي. بالإضافة إلى ذلك، توفر المدينة أسلوب حياة عالي الجودة مع مجموعة واسعة من الأنشطة الترفيهية والفرص الثقافية، مما يجعلها وجهة جذابة للمهنيين الذين يسعون إلى النمو الوظيفي والتجارب الغنية.
موقع تجميع وظائف من جهات خارجية. الحقول المنظَّمة (المهام، المتطلبات، المزايا، التعليم، الراتب، الأسئلة) مُستنبَطة آلياً من الإعلان الأصلي وقد تكون غير دقيقة. يُرجى التحقّق عبر الموقع الرسمي لصاحب العمل قبل التقديم.