CivArchive
    StoryChain Lab [2.0] [py] - Od obrazu do powieści. Krok po kroku [textGen] [only Polish language] - v2.1
    Preview 132523571

    (wersja stabilna) (model zwraca tekst po polsku) (testowane na lokalnych modelach multimodalnych: qwen3-vl-8b-instruct Q6_K, nsfwvision-qwen3-vl-8b oraz gemma4 E4B Instruct Q6_K, modele no thinking)

    StoryChain Lab to eksperymentalne środowisko do budowania narracji krok po kroku przy użyciu lokalnych multimodalnych modeli językowych. To laboratorium narracyjne.

    Program nie działa jak generator książek. Zamiast tego prowadzi model przez serię etapów:

    • analiza obrazu,

    • interpretacja klimatu i świata,

    • budowa postaci,

    • tworzenie konfliktu,

    • szkic fabularny,

    • końcowa historia.

    Każdy etap staje się kontekstem dla następnego. Dzięki temu użytkownik może obserwować, jak model rozwija narrację warstwa po warstwie zamiast generować wszystko jednorazowo.

    Możliwości:

    • analiza obrazu przy pomocy modeli multimodalnych,

    • budowa kontekstu fabularnego etapami,

    • zachowuje ciągłość między kolejnymi krokami,

    • generuje szkice świata, postaci i konfliktów,

    • tworzy eksperymentalne historie na bazie jednego obrazu,

    • pozwala użytkownikowi ręcznie poprawiać każdy etap,

    • działa całkowicie lokalnie przez LM Studio.

    Najważniejszy element projektu to możliwość obserwowania procesu „myślenia narracyjnego” modelu w wielu krokach.

    W praktyce oznacza to, że użytkownik może zobaczyć:

    • jak model interpretuje obraz,

    • jak rozwija motywy,

    • jak buduje zależności między elementami świata,

    • gdzie zachowuje spójność,

    • oraz gdzie zaczyna się gubić.

    To nie jest:

    • profesjonalny silnik do pisania powieści,

    • stabilny system pamięci długoterminowej,

    • AI rozumiejące fabułę jak człowiek,

    • generator perfekcyjnych historii,

    • system gwarantujący logiczną spójność.

    Modele lokalne nadal mają ograniczoną pamięć kontekstową i ograniczone rozumienie narracji.

    ograniczenia:

    • narzędzie zostało opracowane tak aby modele multimodalne generowały tekst po polsku co jest plusem i zarazem minusem, ponieważ tego typu modele znacznie lepiej radzą sobie z narracją po angielsku,

    • po angielsku modele zwykle piszą płynniej, lepiej budują styl, tworzą bardziej naturalne dialogi, lepiej utrzymują klimat i rytm narracji. W języku polskim ograniczenia są znacznie bardziej widoczne.

    • model gemma4 E4B Instruct Q6_K, szybki, dobrze nadaje się do eksperymentów, stabilnie przechodzi przez pipeline etapów. w języku polskim narracja jest często surowa, styl bywa sztywny, tekst może być minimalistyczny, dialogi bywają mechaniczne, opis świata jest uproszczony. Gemma dobrze pokazuje strukturę procesu, ale nie zawsze oferuje „literacką” jakość.

    • modele z rodziny qwen, lepszy styl narracyjny, bardziej naturalne opisy, ciekawsze dialogi, większa kreatywność. W języku polskim wykazują większą tendencje do halucynacji oraz potrafi zapętlić się.

    To narzędzie diagnostyczne. Najciekawsze w tym projekcie nie jest to, że model napisze idealną historię. Najciekawsze jest to, że mimo wielu ograniczeń potrafi utrzymać zaskakująco dużo spójności między kolejnymi etapami generacji.

    Jak to:

    • pobierz .zip, rozpakuj go,

    • musisz posiadać zainstalowane LM Studio, model lokalny multimodalny oraz poprawnie zainstalowany Python,

    • załaduj model multimodlany w LM Studio,

    • następnie uruchom server lokalny w LM Studio. Kliknij na ikonkę [developer], następnie server start,

    • teraz kliknij install.bat celem zainstalowania potrzebnych requirements,

    • teraz kliknij start. bat,

    • pojawi się proste GUI w którym załadujesz obraz testowy,

    • następnie przejdź przez każdy etap analizy i generowania tekstu od stage 1 do stage 6. Poczekaj, aż model zakończy analizę danego etapu i dopiero przejdź do kolejnego.

    • przycisk [zapisz] pozawala na zapisanie wygenerowanego tesku.

    Jeżeli chcesz mieć ciekawszą, rozbudowaną fabułę użyj wersji [eng] plus translacja.

    BARDZO ISTOTE: podczas generowania tekstu nie klikaj w poprzednie etapy. W momencie, w którym zaobserwujesz, że model lokalny z rodziny Qwen zapętlił się (najczęściej zdarza się to w Stage 6) po prostu zapisz tekst i wyjdź ze środowiska. Możesz edytować tekst ale rób to na etapie podsumowań, ewentualnie wprowadzaj małe poprawki do fabuły.

    Description

    (wersja stabilna) (model zwraca tekst po polsku) (testowane na lokalnych modelach multimodalnych: qwen3-vl-8b, nsfwvision-qwen3-vl-8b, modele no thinking)

    Zmiany w wersji [2.1]

    • dodany został translator,

    • modele translacyjne, Bielik-11B-v3.0-Instruct Q5_K_M oraz Translategemma-4b/12b-it Q8_0,

    • teraz masz do dyspozycji suwak temperature, kontrola kreatywności modelu dla poszczególnych etapów. Aplikacja zapamiętuje preferowane ustawienie temperatury dla każdego etapu. Podczas przełączania między etapami suwak automatycznie aktualizuje się do ostatnio zapisanej wartości.

    Jak to:

    • teraz po wygenerowaniu finalnego tekstu w Stage6: Finałowa Fabuła (eng) możesz od razu przejść do translacji tekstu (tekst musi znajdować się w Stage 6). Przejdź do LMStudio, podmień model multimodalny na model translacyjny. Następnie odśwież GUI i Stage 7: Tłumaczenie.

    • możesz importować pliki .txt do GUI celem ich translacji. Klikasz na [Wgraj tekst]. Wczytany tekst pojawia się w Stage 6.

    WAŻNE:

    • podczas generowania tekstu nie klikaj w poprzednie etapy,

    • w momencie, w którym zaobserwujesz, że model lokalny z rodziny Qwen zapętlił się (najczęściej zdarza się to w Stage 6) po prostu zapisz tekst. Wyjdź ze środowiska i wczytaj zapisany tekst,

    • możesz edytować tekst ale rób to na etapie podsumowań, ewentualnie wprowadzaj małe poprawki do wygenerowanych opisów,

    • uważaj na modele multimodalne qwen typu thinking. w przypadku tych modeli nie będziesz mógł obserwować generowania tekstu w czasie rzeczywistym a sam proces potrwa dłużej,

    • testowałem modele: nsfwvision-qwen3-vl-8b-v3 Q5_K_M oraz nsfwvision-qwen3-vl-8b-v3 Q8_0. Ogólnie modele o stopniu kwantyzacji Q4,Q5,Q6 wykazywały większą kreatywność. Modele typu Q8_0 cechuje pewna sztywność.

    • model translategemma może sprawiać problemy w LMStudio.

    Translategemma 4b/12 dla LMStudio:

    • z tym modelem mogą wystąpić pewne problemy,

    • przeprowadź następujący test. Wczytaj model tgemma do LMStudio. Wyślij tekst do tłumaczenia. Jeżeli zostanie wyświetlona informacja o błędnym prompt templates musisz wykonać kroki opisane poniżej,

    • przejdź do [models]. zaznacz model translategemma-4b/12b-it.Q8_0, przejdź do [inference] (po prawej stronie),

      następnie odszukaj [prompt template], znajduje się po prawej stronie na samym dole w [inference],

      wybierz [prompt template] [maunal],

      zmień choose template na [ChatML]. Teraz tgemma będzie działać prawidłowo w LMStudio.

    Aplikacja zawiera plik knowledge_base.json. Tu możesz dodawać własne słowa dla translatora. Dotyczy to głównie treści NSFW dla modelu translategema. Jednak aby ta baza danych działała musisz ściśle przestrzegać formatu zapisu. np:.

    {

    "słowo angielskie": "twoje tłumaczenie",

    "słowo angielskie:": "twoje tłumaczenie",

    "słowo angielskie": "twoje tłumaczenie"

    }

    zwróć uwagę na brak przecinka w ostatniej linii, to ważne, inaczej baza danych nie zostanie wczytana.

    Other
    Other

    Looks like we don't have an active mirror for this file right now.

    CivArchive is a community-maintained index — we catalog mirrors that volunteers upload to HuggingFace, torrents, and other public hosts. Looks like no one has uploaded a copy of this file yet.

    Some files do get recovered over time through contributions. If you're looking for this one, feel free to ask in Discord, or help preserve it if you have a copy.

    Details

    Downloads
    0
    Platform
    CivitAI
    Platform Status
    Deleted
    Created
    6/1/2026
    Updated
    6/23/2026
    Deleted
    6/1/2026