Содержание
Если вы когда-нибудь собирали ПК по ролику на YouTube, вы знаете боль: видео хорошее, но нужный момент потом не найдёшь. В Google Gemini это пытаются закрыть простым трюком — одним промптом, который превращает how-to ролик в письменные шаги с таймкодами и списком инструментов.
Фишка держится на нативной возможности Gemini «смотреть» YouTube и пересказывать содержание по ссылке. Достаточно дать модели URL ролика и попросить конкретный формат ответа.
Что именно делает промпт для Gemini
Вместо общего пересказа Gemini можно заставить собрать текстовую «шпаргалку» по видео: сначала список материалов и инструментов, затем пошаговые действия. Каждый шаг получает короткий заголовок, описание того, что реально показали и сказали в ролике, и таймкод, чтобы быстро прыгнуть к нужному месту.
Ключевой момент — промпт отдельно запрещает модели додумывать советы и «улучшения» от себя. То есть задача не в том, чтобы заменить видео, а в том, чтобы сделать к нему текстовую подложку. Это удобно, когда руки заняты тестом, термопастой или тестом на расстойку.
Watch this YouTube video: [URL]
Create a step-by-step guide based on what’s actually shown and said. Start with a Materials/Tools List — every tool, ingredient, setting, or material mentioned or shown before or during the process.
Then, for each step: give it a number, write a short action-oriented title, then describe exactly what to do using only what the video demonstrates. Include timestamps. If the presenter mentions a specific tool, setting, ingredient, measurement, or material, include it. Where the presenter explains the reason for a step, include that reasoning too. Don’t add context, tips, or advice that isn’t in the video — just document what’s there.
Finally, add a credit for the content creator’s YouTube channel and provide the URL for the actual YouTube video.
Почему это заметно именно на фоне ChatGPT и Claude
В исходном описании подчёркивают разницу подходов. ChatGPT сам по себе не «смотрит» YouTube без сторонних инструментов. А Claude в такой ситуации просит вставить транскрипт вручную. У Gemini тут преимущество: он работает от URL и вытаскивает структуру прямо из ролика.
Какой режим Gemini выбирать
Для коротких роликов до пяти минут советуют режим Fast (Flash). Для длинных видео, особенно где больше десятка шагов, лучше Pro. А режим Thinking называют не самым подходящим, потому что тут важнее аккуратно извлечь данные из источника, а не решать сложную задачу.
Вся идея формулируется просто: человек-автор делает видео, ИИ собирает удобный текстовый конспект, а человек у верстака уже не мечется по таймлайну в поисках «того самого момента».