لقد بنيت آلة المحتوى الذكية الفائقة (وهي جنونية تمامًا)
يا جماعة... لقد انتهيت لتوي من بناء أكثر نظام إنتاج محتوى تعقيدًا وتجاوزًا للحدود، وأنا لست نادمًا على ذلك ولو قليلًا. تخيل هذا: أسجل نفسي وأنا أثرثر مثل سنجاب تناول كافيين زائد لمدة 10 دقائق على هاتفي، ثم أضغط رفع، وفجأة — يحول جيشي من الذكاء الاصطناعي تلك الفوضى العارمة إلى محتوى مدونة مصقول بـاثنتي عشرة لغة. معظم منشئي المحتوى سيعتبرون هذا مبالغة. أنا أعتبره الطريقة الوحيدة التي تجعل عقلي ينتج المحتوى باستمرار.
هذا يشبه إلى حد كبير استخدام قاذف لهب لإشعال شمعة في عالم صناعة المحتوى، لكن اسمعوني — أحيانًا يكون الحل الأكثر جنونًا هو الحل الذي يعمل فعلًا.
قصة نشأة الشرير: لماذا لست (بعد) مستر بيست
دعوني أرسم لكم صورة لواقعي في صناعة المحتوى. هل تعرفون أولئك اليوتيوبرز الذين يمكنهم فقط تشغيل الكاميرا وتقديم محتوى ناري لـ20 دقيقة متواصلة؟ أجل، هذا ليس أنا. ضعوني أمام كاميرا مع نص مكتوب وسأتحول إلى روبوت معطل يحاول تذكر كيف يعمل الكلام البشري.
عقلي يعمل أشبه بفيديو يخزن مؤقتًا — الكثير من التوقفات، والاستطرادات العشوائية، ولحظات "انتظر، ماذا كنت أقول؟". أنا نقيض المؤثرين عندما يتعلق الأمر بالإلقاء السلس. لكن إليكم المفاجأة: تلك التفريغات الدماغية الفوضوية وغير المصفاة؟ هناك يكمن الذهب الحقيقي.
فكروا في الأمر هكذا — المحتوى المصقول يشبه صورة إنستغرام معدلة بشكل مثالي. تبدو رائعة، لكنكم تعلمون أن هناك واقعًا فوضويًا كاملًا خلف تلك اللقطة المثالية. مقاطع الفيديو الهاتفية الثرثارة الخاصة بي هي لقطات ما وراء الكواليس، وبصراحة، هناك تختبئ الرؤى الحقيقية. المشكلة هي أن لا أحد يريد الجلوس لمدة 10 دقائق من "اممم، في الواقع، انتظر، دعوني أفكر في هذا بطريقة مختلفة..."
لذا بدلًا من إجبار نفسي على أن أصبح شخصًا لستُه، بنيت نظامًا يسمح لي بأن أكون فوضويًا بصدق ويتولى كل التنظيف في مرحلة ما بعد الإنتاج. إنه كأن يكون لديك فريق تحرير كامل، لكن بدلًا من قص لقطات إضافية، هم يقطعون أفكاري المتفرقة إلى شيء منطقي فعليًا.
خط تجميع المحتوى: كيف تُصنع النقانق
خط الإنتاج هذا يحتوي على أجزاء متحركة أكثر من آلة روب جولدبرج، وأنا فخور حقًا بكل قطعة معقدة فيه.
يبدأ الأمر ببساطة — لدي سكربت بايثون يقوم باستخراج الصوت من أي فوضى صورتها على هاتفي للتو. ملف M4A هذا يُرفع إلى بوت تيليغرام المخصص لدي (لأنني على ما يبدو حولت تيليغرام إلى خادم ذكاء اصطناعي شخصي)، والذي يعمل على خادمي الافتراضي الخاص ويبدأ العمل فورًا.
يقوم البوت بتحميل الملف ويغذيه إلى Whisper — نموذج تحويل الكلام إلى نص من OpenAI الذي أُشغله محليًا. فيخرج نص يشبه أن شخصًا ما نسخ حلمًا محمومًا، مع كل "اممم" وأفكاري غير المكتملة.
ثم يحدث السحر الحقيقي. يدخل هذا النص إلى ما أسميه ساحة معركة الذكاء الاصطناعي — مرحلة متعددة الخطوات حيث يتصارع نموذجان من الذكاء الاصطناعي لإنشاء شيء قابل للقراءة بالفعل:
الجولة الأولى: كلود يأخذ الضربة الأولى. يحصل كلود على النص الخام ومهمته أن يكون المحرر الودود — غير رسمي، صادق، ربما يحتوي على تفاصيل تقنية كثيرة، وبالتأكيد الكثير من الاستطرادات بين قوسين (مثل هذه). كلود يضيف هيكلًا، يستخرج الأفكار الرئيسية، ويجعله يبدو وكأن إنسانًا حقيقيًا كتبه.
الجولة الثانية: ديب سيك يلعب دور محامي الشيطان. يدخل ديب سيك إلى المحادثة بطاقة فوضوية خالصة. مهمته أن يكون الصديق الذي يثقب أفكارك — تدقيق الحقائق، إضافة عمق تقني، السؤال "لكن ماذا عن...؟". هو يأخذ مسودة كلود ويصبح في الأساس ذلك المعلق الذي يقول "في الواقع، لقد فاتك هذا الشيء المهم". ديب سيك قاسٍ بشكل مدهش في هذا.
الجولة الثالثة: كلود يلعب دور الحكم. يحصل كلود على كلا النسختين ويصبح المُركِّب النهائي. السرد الشخصي من المسودة الأولى ممزوجًا بالدقة التقنية التي أضافها ديب سيك. الحفاظ على الشخصية مع إضافة الجوهر.
Get new posts
Subscribe in your language
New posts delivered to your inbox. Unsubscribe anytime.
Receive in: