Гослук

Со ВИ можеме да го премостиме деценискиот јаз во нашата култура

…или: „Што научив од анимирањето кус филм според роман со помош на вештачката интелигенција“

…или „Неколку зборови за тоа дека вештачката интелигенија не е непријател – таа (може да бид)е сојузник!“

Пишува: Бранко Прља

Откако се впуштив во светот на генеративната ВИ, доживеав многу интересни нешта. Како прво, општа осуда од уметничката и стрипската сцена во МК. Особено по издавањето на мојата графичка новела. Се зачудив како повеќето мои колеги не се заинтересирани за содржината (се работеше за адаптација на мојот најпопуларен роман кој влезе во финалето за наградата „Роман на годината“), туку автоматски и „по дифолт“, без да прочитаат, веќе имаа изградено негативен став.

Во ред, ми беше јасно, не ја сакаа примената на вештачката интелигенција во уметноста, и самиот сум поминал низ истата фаза. Кога ВИ се популаризираше, бев престрашен. Загрижен за својата егзистенција како графички дизајнер, но и за суштината на она што го правам и ме дефинира како човек – пишувањето. Без тоа сум ништо, а сега се појавува нешто што може да ме имитира, а и да им овозможи на другите да го прават истото без никаков напор. Што ќе работи мојата ќерка, која е креативно дете (што е документирано во неколку книги со нејзини приказни и цртежи) во иднина? Многу прашања ми висеа над глава.

Она што го поминав во следниот период, Владимир Карер (мојот соработник на порталот „Арно.мк“ го нарече „5 стадиуми на соочувањето со ВИ“ (како аналогија на „5 стадиуми на тагата: негирање, гнев, спогодба, депресија и прифаќање). Низ истиот процес поминуваат сите.

Набрзо разбрав дека целата историја на технологијата е исполнета со слични случаи и дека ако уметниците се откажат од технологијата и не се прилагодат, ќе останат во историјата. Всушност, технологијата е (и отсекогаш била) наш сојузник. Таа го забрзува и олеснува процесот на создавање и тие кои се креативни ќе знаат како правилно да ја искористат. Видов голем потенцијал во ова и прилика да го надополниме деценискиот јаз во културата кај нас кој настана со иселувањето на повеќето луѓе кои вредат и знаат нешто. Нашата земја може да има многу корист од овие технологии ако знаеме како да ги искористиме.

Тоа што треба да направиме е да ги обучиме младите, креативците кои би можеле да организираат работилници (или да даваат совети онлајн) и да бидат некој вид диригенти во креативниот процес на тие кои немаат искуство. Истото се обидувам да го направам преку мојот портал арно.мк, каде што отворено зборувам за креативниот процес со примена на ВИ и ги споделувам искуствата, во надеж дека ќе ги инспирирам другите.

Сите овие напори би можела да ги финансира државата, бидејќи се од национален интерес. Би требало да изградиме цели креативни фабрики во кои ќе работиме на промоција на нашиот идентитет, културно наследство, да се претставиме пред светот и да дознаат повеќе за нас. Тоа може да биде и алатка за промени, за подобрување на нештата, за ширење на еколошка свесност. Тоа всушност се обидов да го направам со мојот краток филм „Мечказила vs. Токсиволк во битката кај Скорне“ (верзијата на македонски јазик), а ова е верзијата на англиски:

 7 лекции кои ги научив од анимирањето кус филм со помош на вештачка интелигенција

Филмот го работев неколку месеци, со тоа што целата приказна започна од еден роман кој го пишувам со прекини веќе една година. Малку заглавив со романот поради други ангажмани и решив да го издадам како графичка новела. Но, во процесот на работа сфатив дека би функционирал добро и како анимирана приказна. Така дојдов до идејата за кус филм. Во текот на работата ги научив овие лекции.

1) Pika и Runway (за сега) се најнапредни апликации за ВИ видео

Постојат многу апликации за генерирање видео од слика или од текст, како на пример Veed, Haiper, MagicHour, Pixverse, Kaiber, Genmo, Leiapix. Интересно е дека секоја од нив е слична, но и различна. Некои се поинтуитивни и доволно е да се аплоадира слика и знаат што треба да прават, додека други бараат повеќе наредби и играње со агли, движење на камера, зумирање итн. Некои се подобри за конзистентност на ликови, други се покреативни, некои даваат повеќе движење, други се подобри за анимирање аморфни објекти како чад или вода итн.

Секоја програма има свои предности и слабости. Тука е потребно многу експериментирање. Не секогаш се добиваат посакуваните резултати и при идентични сетинзи. Честопати и случајноста игра улога. Кога ќе го добиете вистинскиот резултат, летаат конфети.

Pika и Runway остануваат најнапредни апликации за ВИ видео, но откако Sora ќе излезе за јавна употреба мислам дека никој веќе нема да може да и’ конкурира. Во блиска иднина за да направиш филм нема да биде потребна ни камера, ни актер, ни сценографија, ни костимографија… едноставно еден човек зад компјутер. Дали е тоа добро или лошо не знам, но неминовно е.

2) Вештачката интелигенција оди напред и никој не може да ја сопре

Неверојатен е напредокот во генерирање ВИ видеа. На арно.мк веќе зборувавме дека оваа година најголем напредок во областа на генеративна ВИ ќе се оствари на тоа поле и навистина е така. Само пред една година постоеја две-три апликации, денес се десетици. Но, не се работи за квантитативен, туку за квалитативен скок. Квалитетот на видеата кои можат да се генерираат е неспоредлив.

3) ВИ сака реалистичен стил

Она што е недостаток, според мене, е тежнеењето кон хипер-реалистичен стил во генеративната ВИ. Ова се препознава и во апликациите за генерација на слики (пред се најнапредната Midjourney) и кај апликациите за генерирање видео. Ги видовме можностите на Sora. Таа создава хипер-реалистични видеа, а најинтересно е што е тренирана на синтетички видеа (Unreal Engine и други).

Како графички дизајнер кој завршил уметност, се „образувал“ во школата на Небојша Гелевски-Бане (Кома), Темплум и Точка, препознатливи по графичарскиот стил, моно-дво-трихроматски дизајн, типографија и слично, не го сакам многу фотографскиот стил. Тоа ми претставуваше голем проблем во анимирањето на сликите за кусиот филм кои првично ги правев со стрипска естетика (бидејќи ги генерирав за графичката новела).

Во анимирањето програмите знаеја многу често таквиот стил да го морфираат во фотографски стил, и тоа во видео кое трае 3 секунди (овие програми генерираат видеа со максимално траење од 3-4 секунди). Затоа, откако го направив целото видео, на крај решив да го сменам стилот сосема за да добијам подобри резултати. Така тргнав од почеток со генерирање на нови слики.

4) Со ВИ не можеш секогаш да го добиеш тоа што го сакаш (и тоа е интересното)

Освен таа пречка, не секогаш е предвидливо на кој начин ќе се одвива движењето на објектите од една мини-сцена (бидејќи секоја трае по 3-4 секунди). Ако сакаме, да речеме некој објект да се движи во една насока или карактерот да изведе одредено движење, мораме да го побараме тоа со наредба, но тоа не значи дека ќе го добиеме.

Исто така, како што споменав, сите програми не реагираат исто. Затоа истата сцена ја правев во сите гореспоменати апликации и потоа ја бирав најдобрата, а најчесто морав да се обидувам и по неколку пати. За одредени анимации користев и ефекти на програмата за едитирање видеа CapCut. Одредени сцени се композитни од повеќе слики исечени во Photoshop како лејери и анимирани во Adobe Premiere.

Но, генерално гледав да избегнувам премногу такви елементи и да не комплицирам бидејќи оваа вежба беше битна за мене како “proof of concept” – дека секој, без многу технолошки познавања би можел да го направи истото. Она што ми беше најинтересно е елементот на непредвидливоста, кога случајно ќе добиеш некој резултат, и во тој случај вештачката интелигенција станува режисерот.

5) Кусите филмови се добри за прикажување фрагмент од приказна или атмосфера

Мојата основна грешка беше тоа што се обидов да „напикам“ цел роман во куса временска рамка. Бидејќи оригиналот на кусиот филм беше направен на англиски, наменски за Фестивал на AI филм, ограничувањето на траењето беше 10 минути. Првичната верзија, и покрај сите кратења ми излезе 15 минути. Потоа исфрлував делчиња додека не дојдов до границата. Сепак, од процесот на работа заклучив дека многу полесно би поминал кога би адаптирал еден фрагмент од приказната, наместо целата, или кога би се обидел да прикажам една идеја – наместо комплексна целина.

Замислете го ова: Ѓубрето е бизнис. Загадувањето создава генетски мутации кои се шират како вирус. Јан е борец за чиста околина кој се наоѓа во сплет на околности кои го водат кон изворот на загадувањето. Фабриките и депониите се изворот на болеста. Мечказила и Токсиволк се монструми кои се хранат со загадувањето, но тие, како и секој друг литературен монструм се симболични. Јан е херојот, но тој не менува ништо, туку е нем сведок, што е симбол за обичниот човек, жртва на загадувањето и негрижата за околина. Но, и тој самиот е виновник бидејќи го поттикнува лудиот научник на акција. Сето тоа е и метафора за пандемијата, маските и вирусите.

Во романот сето тоа има тек и развој, ликовите се градат постепено, навлегуваме во психологијата на Јан и на жртвите на загадувањето, што значи тоа за нивниот секојдневен живот, опкружени со грдотија, депонии, живеејќи во страв за иднината. Идејата е прекомплексна за кусо видео. Но, тоа е што е!

6) Нарацијата е добра… за книга, не и за краток филм

Мојот пристап е наративен, бидејќи сум пред се писател. Тоа е нешто што би сакал да го сменам ако продолжам да правам вакви филмчиња. Порано експериментирав со CutCap и со помош на програмава правев едукативни филмчиња, кои се екстензија на мојата едиција „Фактопедија“, кратки факти за познати научници, уметници, изуми и слично.

Наративниот стил се пренесе и на ова дело, бидејќи основата е роман. Но, со текот на работата, кратејќи го филмот, се повеќе ја кратев и нарацијата. На крај помислив дека би било добро да се исфрли сосема, но некои работи не би биле доволно јасни.

7) Пресуда: што направив и што треба да правам?

Дали сум задоволен од она што го направив? Искрено, и да и не. Може и подобро, се разбира и јас учам со секоја нова авантура. Зошто едноставно не се држам до пишувањето, што се фаќам со работи каде не ми е местото? Од две причини. Прво, сметам дека мојата улога, како на т.н. „интелектуалец“, е да ги инспирирам другите. Тие ќе продолжат таму каде сум застанал, ќе го поминат нивото на кое сум заглавил и заеднички ќе создадеме нешто вредно. Културното наследство не може да биде дело на еден човек, туку е колективен напор. Затоа е битно здружувањето во физички и виртуелни сфери, размената на искуства, учење од грешките итн.

Второ, за мене лично пишувањето веќе одамна стана претесно. Чувствувам дека не можам доволно да се искажам само со зборовите, правев експерименти во речиси сите жанрови, па и измислив некои мои и што потоа? Пред многу години некој ме праша за каков писател се сметам, реков дека воопшто не се сметам за писател, туку за експериментатор со зборови. Сметам дека дури и тоа е претесно, така што сакам да експериментирам со медиуми, технологии и можности.

Порано се занимавав со илустрација многу повеќе, тоа за мене беше медитативен чин, но поминаа години откако го правев тоа активно. Преку експериментирањето со ВИ открив толку нови и возбудливи стилови и личности во уметноста што тоа во мене повторно ја разбуди желбата за цртање и експериментирање и во тој свет. Затоа (меѓу другите наведени причини) на ВИ гледам како на позитивна и движечка сила во светот. Сметам дека не само што таа нема да ја уништи креативноста, туку напротив дека човечкиот труд ќе се почитува уште повеќе, нешто како уникатен занаетски труд, во однос на индустриско производство. Уметниците ќе добијат на цена и ќе бидат почитувани. Ок, можеби врвните да, а ние другите имаме шанса да бидеме заменети. Но, токму тоа дава мотив за повеќе труд и оригиналност, нели?

Откако ги научив/ме лекциите, што понатаму?

Лично планирам да ги применам научените лекции на дело. Но, можеби прашањето што научив јас и не е толку битно, туку што можеме да научиме ние, како нација. Прво, ВИ не ни е непријател. Второ, мораме да ја учиме и применуваме, ако сакаме да бидеме колку-толку релевантни и да креираме актуелни содржини. Трето, поискусните треба да ги обучат понеискусните, за да ни биде подобро на сите.


П.С.: Текстов е напишан пред неколку месеци и се наоѓа во „Стожер“ бр. 153. Од тогаш се појави нова апликација која ги надмина Pika и Runway и се вика Luma Dream Machine. Со тест/споредба со една сцена од краткиот филм основните разлики се проценуваат како:

– Runway и Pika ја третираат сликата како статичен објект (повеќе или помалку), додаваат некои елементи и се држат до барањето (prompt). Ако го прошируваат кадарот тоа го прават со голем број грешки и менување на стилот.

– LUMA го проширува кадарот и ја поместува камерата, при тоа задржувајќи го стилот и визуелната логика, и воведува нови сцени кои не постојат во оригиналната слика.


Текстот е објавен и во списанието „Стожер“ бр. 153.

Што мислиш ти?