📌 ما يحتويه كل ملف حالياًالملف المحتوى الحاليAGEN

Blog Post

عنوان المحادثة: 📌 ما يحتويه كل ملف حالياًالملف المحتوى الحاليAGENTS.md التعليمات الك...

التاريخ: 29.04.2026 - 30.04.2026

التصنيف: 🧠 الذكاء الاصطناعي وتعلم الآلة

إجمالي الرسائل: 24 | ياسر: 16 | M: 8

Yasser

📌 ما يحتويه كل ملف حالياًالملف المحتوى الحاليAGENTS.md التعليمات الكاملة للـ AI، بنية المجلدات، معايير التقييم، قائمة مراجعة بداية/نهاية الجلسةPROJECT_MEMORY.md حالة المشروع (5% مكتمل)، معلومات الـ 28 مشروع، القرارات المبدئية (Python, pdfplumber, GPT-4o)، المخاطرDECISIONS.md 10 قرارات مسجلة: هيكل الذاكرة، اللغة، استراتيجية PDF، استراتيجية LLM، المخطط المخرجات، التقييم، فصل Gold Outputs، الأولويات، هيكل الريبو، حلقة التصحيحPROGRESS.md 9 مراحل مع جدول زمني (48 ساعة)، كل مهمة بحالةها (تم/جاري/لم يبدأ)، الحواجزTASKS.md 12 مهمة نشطة (T001–T012) + 9 مهام مستقبلية، مع الأولويات والاعتمادياتARCHITECTURE.md تصميم كامل للنظام — 6 مكونات (Input → Ingestion → Extraction → Output → Evaluation → Correction)، نماذج البيانات، المكدس التقني، هيكل المجلداتLESSONS.md درسان مسجلان: فهم بنية البيانات، ومشكلة طول المسارات في WindowsCONTEXT.md معرفة مجال البناء — أنواع المشاريع، الترادات (Trades)، الوحدات، أنواع الملفات، كيفية استخراج الكميات، المصطلحات

Yasser

🔄 بروتوكول الاستخدامفي بداية كل جلسة عمل، يقرأ الـ AI:AGENTS.md.kimi/PROJECT_MEMORY.md.kimi/TASKS.md.kimi/PROGRESS.mdفي نهاية كل جلسة عمل، يُحدِّث الـ AI:.kimi/PROGRESS.md — ما تم إنجازه.kimi/TASKS.md — تعديل الحالات وإضافة مهام جديدة.kimi/DECISIONS.md — أي قرارات اتُّخذت.kimi/LESSONS.md — أي دروس تعلمناها.kimi/PROJECT_MEMORY.md — تغييرات الحالة

Yasser

# PDF Processingpdfplumber>=0.10.0PyMuPDF>=1.23.0# OCRpytesseract>=0.3.10Pillow>=10.0.0# Data Processingpandas>=2.0.0numpy>=1.24.0# LLMopenai>=1.0.0anthropic>=0.20.0# String Matchingrapidfuzz>=3.0.0# Data Validationpydantic>=2.0.0# Environmentpython-dotenv>=1.0.0# Testingpytest>=7.0.0

Yasser

هناك Rate Limit من OpenAI. لكن النظام استخرج 65 بنداً إضافية (35 من Addendum + 30 من Break Out). الآن لدي:38 من Scope of Work65 من Addendum + Break Outالإجمالي: 103 بنودما زلت أحتاج لمعالجة:Maryland Vision Institute_Drawings.pdf (41 صفحة)Maryland Vision Institute_Specifications.pdf (454 صفحة)لكن بسبب Rate Limit، يجب أن أبطئ الطلبات أو أنتظر بينها.دعني أدمج النتائج الحالية في ملف واحد وأعرضها للمستخدم. ثم أعالج الملفات المتبقية.في الواقع، دعني أبني سكربت يجمع كل النتائج ويحفظها.

المحادثة الكاملة - 29.04.2026 - 30.04.2026

ده Assessment لـ AI Takeoff Builder Challenge — اختبار تقني لبناء نظام backend:المطلوب باختصار:المشكلة:عندك ملفات مشاريع بناء (construction takeoff) — خطط، تعديلات، مستندات — ومحتاج تبني نظام backend يقدر:1. يقرأ الملفات دي2. يطلع estimates (كميات، وحدات، تكاليف)3. يقارن النتائج بالـ outputs اللي عملها بشرالداتا:• 3 sample projects (مع expected outputs — عشان تفهم الشكل المطلوب)• 25 challenge projects (محتاج تطلع outputs ليهم)• Google Drive folder بالملفاتالمطلوب تبنيه في 12 ساعة:1. Architecture Plan — إزاي النظام هيشتغل، data model، pipeline2. Working Prototype — كود شغال يقدر: • يقرأ الملفات • يطلع structured takeoff outputs • يقارن predictions بالـ gold outputs (للـ sample projects)3. README — إزاي تشغله، إيه الـ tools اللي استعملتها4. 10-min Loom video — walkthrough للي بنيته5. 30-Day Execution Plan — لو اتوظفت، إيه اللي هتبنيه في أول 30 يومالـ Evaluation بيركز على:• فهم المشكلة (مش UI polish)• System design & backend architecture• Data discipline (فصل inputs عن gold outputs)• Structured outputs (line items, quantities, units)• Evaluation loop ( scoring method)• Honesty (قول إيه اللي مش خلصته)الـ AI مسموح بيها:ممكن تستخدم LLMs, OCR, vision models — بس لازم تقول إيه اللي استعملته───اختصار الاختصار:بناء نظام backend يقرأ ملفات بناء ويطلع estimates مقارنة بالـ outputs البشرية — في 12 ساعة.عايز تشتغل عليه؟ 🖤

29.04.2026 21:29

انا فهمت انو في training

29.04.2026 21:38

ياسر

29.04.2026 22:53

ياسر

29.04.2026 22:53

rag?

29.04.2026 23:14

لانو المشروع ماشي بنظام model training ف مستغربة

29.04.2026 23:14

ياسر

29.04.2026 23:20

mathaq_alnoor@hotmail.comH@f4f26yLu65Shttps://app.karzoun.chat/app/accounts/1802/settings/agents/list

29.04.2026 23:28

ياسر

ال openai key

29.04.2026 23:58

ياسر

ال openai

30.04.2026 00:01

ياسر

30.04.2026 00:27

ياسر

ما الطرق المتاحة للتوفير في التوكنز في المعالجة من openai?

30.04.2026 00:44

ياسر

Chunking أكبر (30000 حرف بدلاً من 12000)تخطي الصفحات الفارغة (استخدام gpt-4o-mini للملفات الكبيرةmax_tokens=2000Prompt مختصرإضافة delay بين الطلبات

30.04.2026 00:47

ياسر

ممتاز! النظام المحسّن يعمل بشكل أسرع وأفضل:Chunking أكبر قلل عدد chunks بشكل كبيرgpt-4o-mini للملفات الكبيرة يعمل بسرعةالتصفية قللت الصفحات غير المهمةلكن عدد البنود أقل (187 مقابل 405 سابقاً). هذا لأن gpt-4o-mini قد يستخرج بنود أقل دقة. لكن هذا مقبول.الآن دعني أبدأ بمعالجة TAKEOFF-50 و TAKEOFF-56.

30.04.2026 00:51

استعمال rag system

30.04.2026 01:45

ياسر

في الواقع، أفضل طريقة الآن هي:نبني سياق المشروع من جميع الملفات (SOW + Specifications + Drawings)نرسل هذا السياق كاملاً للـ LLMنطلب استخراج بنود مطابقة للتقدير البشريلكن هذا سيستهلك كثيراً من API tokens.

30.04.2026 01:52

ياسر

GPT-4o Vision

30.04.2026 01:59

ياسر

GPT-4o Vision

30.04.2026 02:07

ياسر

Page 13: Floor Finish LegendCPT: Carpet, J&J, BroadloomLVT: Luxury Vinyl, ArmstrongPage 14: Ceiling Plan LegendCeiling Grid (2' x 2' ACT)ACT (2' x 2')Page 20: Room Finish ScheduleRoom 100-F (CORRIDOR): Floor=LVT5, Base=B7, Walls=PT-1, PT-2Page 32: HVAC ScheduleRTU-1, CPG360SGDAC-1, AVXC200Page 33: Duct Hangers DetailDuct Sizes: 36x15, 48x15

30.04.2026 02:16

ياسر

الأوصاف أصبحت أفضل! لكن:"PT-1 (Height): Mfg: [manufacturer], Color: [color], Type: [finish type]" - LLM لا يعرف الألوان الحقيقيةالكميات لا تزال nullالسياق يحتوي على رموز (PT-1, PT-2, CPT, LVT) لكن لا يحتوي على الألوان الحقيقية لأن الرسومات نفسها لا تحتوي عليها (هي في التقدير البشري فقط).دعني أقيم النتائج الجديدة.

30.04.2026 02:18

ياسر

30.04.2026 02:19

ياسر

30.04.2026 02:19

ليش ما تستعمل rag ?

30.04.2026 02:27

في ال rag الو مسار تاني

30.04.2026 02:29

← العودة إلى الرئيسية