przemelek: czerwca 2026

piątek, czerwca 19, 2026

Zauroczył mnie Cladue Code ;-)

Dostałem w pracy Claude Code, w takiej specjalnie wersji, że nie gada do Anthropica, a działa z modelami na AWS Bedrock.
Mam limit 200 USD miesięcznie (nie wiem jak jestem daleko czy blisko tego limitu ;-)).

Ale od tego Claude Code się można uzależnić - do tego człowiek zaczyna być bardzo defensywny w pisaniu.
"Zrób X, tak by Twoje wyniki były takie same jak z Y, stwórz listę hipotez jak Y działa i testuje je sprawdzając Twoje wyniki z tymi z Y, pamiętaj nie wolno Ci używać Y do tego by dostać wyniki, masz prawo do tego tylko by stworzyć baseline do którego będziesz porównywać swoje hipotezy" ;-)

Ale przyznaję, że kusi mnie by wejść prywatnie w Claude Code PRO, ma co prawda dużo mniej tokenów, ale ja w domu znów nie rozwiązuję tak wielu rzeczy.

Mam Claude Code z lokalnymi modelami na moim Mac Mini M4 Pro z 64 GB RAM, ale jednak Qwen3.5 czy Gemma4:31b są fajne, ale nie umywają się do "prawdziwych" modeli ;-)

Tzn. Antygravity ma wersję CLI, wcześniej było Gemini CLI, ale Claude Code wydaje się mieć w sobie "to coś". Poprosiłem o raport z porównania 2 rzeczy i dodałem, że fajnie by było jakby dodał do tych issue ich lokalizację jako lat, lon... to on mi dodał mapę i pokazuje to na mapie ;-)

Trochę taka praca z Claude Codem czy podobnymi toolami to nadzór nad super produktywnym i bardzo bystrym, ale też bardzo "tępym" koderem, który umie na pisać masę rzeczy - ale nie zawsze myśli o tym czy one mają sens ;-) [

To jest trudne do uchwycenia, że te narzędzia do vibe codingu potrafią zrobić w kilka minut coś co nam by zajęło kilka tygodni albo i dłużej, z drugiej strony co jakiś czas robią tak głupie rzeczy, że człowiek się zastanawia jak to w ogóle może działać - sztuka, której się ciągle uczymy to znalezienie tych miejsc z "przebłyskami geniuszu" i blokowanie wchodzenia w pętle robienia tej samej głupiej rzeczy w kółko - wyrok jeszcze nie zapadł czy tak się da pracować ;-)

Podobne posty^beta
Zdolny Junior z rozmachem ;-) zwany też jako Claude Code
Agent nie na wszystko pomoże ;-)
Okrucieństwo vibe codingu część 2 ;-)
Jak masz doła to nawet rozwiązanie problemu niezbyt cieszy ;-)
Agent by Agent ;-) czyli o tworzeniu agenta AI agentem AI ;-)

czwartek, czerwca 18, 2026

Heurystyki kasowe – jak z OS-ów w branży lub firmie wyczytać potencjalne zarobki

Taka obserwacja z rynku, a może bardziej obserwacji rynku przez ostatnie 20+ lat ;-)

Jest prosta heurystyka dla stwierdzenia czy w danym biznesie/danej gałęzi gospodarki jest dużo czy mało pieniędzy dla programistów (i ogólnie też).

Wystarczy popatrzeć na OSy używane do uruchamiania większości podstawowych narzędzi ;-)

Jeśli większość specjalistycznego softu jest dla Windows to raczej jest mało kasy w tym biznesie. Bo i klienci i dostawcy działają na Windows, które zwykle trafia do firm gdy te zamawiają "najtańszy" komputer.

Windows + Linux - tu już jest lepiej, bo fakt istnienia wersji dla Linuksa sugeruje, że część tego softu będzie działała na serwerach, czyli mamy już coś co wymaga by usiadł do tego ktoś z wyższą pensją ;-)

Windows + Linux + macOS - OK, tutaj jest soft, który jest "dla wszystkich", są w miarę znośne pieniądze.

macOS + Linux - No i jesteśmy w miejscach gdzie dobrze płacą ;-)

To jest heurystyka - więc działa zwykle, ale nie zawsze - gry AAA są praktycznie tylko na Windows, ale już masa softu używanego do tworzenia elementów w grach działa też na macOS ;-)

To samo jeśli chodzi o ocenę firmy gdy się jest na rozmowach:

Windows wszędzie -> pieniędzy dużych tu nie będzie,
Windows czasem -> kasa znajdzie się,
Mac i Linux rządzą wszędzie -> kasy dużo zwykle będzie ;-)

Podobne posty^beta
Heurystyka dostępności a strach przed imigrantami
Przyśpieszanie backtrackingu
Czemu obecny Sejm i rząd są wyjątkowe?
"os.arch", "os.name", "sun.arch.data.model" co to jest i co pokazuje na jakiej maszynie i OSie? ;-)
YouTube/Facebook/Instagram dla jedzenia by nie przeszedł ;-)

poniedziałek, czerwca 08, 2026

Monachium to złe lotnisko jest ;-)

Ja i lotnisko w Monachium się jakoś nie lubimy ;-)

Dwa lata temu leciałem do Wenecji przez Monachium (w końcu, nie jestem pewien jak to się zaczęło, ale były cancele i rebooking)... i samolot z Krakowa się spóźnił i spałem w Monachium...

Tydzień temu miałem lecieć z Krakowa do Rzymu przez Monachium... tym samym chyba nawet kodem jak ten przypadek sprzed 2 lat.... nie poleciałem bo najpierw samolot był spóźniony od 3h, a później zrobili podsłuchałem (stałem obok gate'u), że robili dodatkowy przegląd techniczny, w końcu próbowali resetować komputer i w końcu... Cancel, rebook na następny dzień na lot z KRK do FCO bezpośrednio, ale z LOTem ;-)

No i dziś (czy już wczoraj) wracałem z Rzymu do Krakowa przez Monachium.... ale podobno w Monachium pożar był, albo dym czuli... w każdym razie zamknęli lotnisko i wylądowałem w Stuttgarcie ;-)

Po perypetiach wylądowałem w hotelu, który sobie samo bookowałem (IHG rządzi... nadal ;-)) i w końcu (po ponad godzinie) dostałem nawet maila z info, że jutro lecę ze Stuttgartu do Krakowa z Eurowings...

Widzę, już że:

będę musiał zacząć bookować bilety nie przez Lufthanse,
będę musiał unikać połączeń przez Monachium

Podobne posty^beta
Co się dzieje jak Ci zrobią Cancel lotu na lotnisku "startowym"?
Nie lubię Lufthansy
Kurza twarz ;-)
Punkty uzależniają ;-)
Reset

środa, czerwca 03, 2026

O urokach uprzęży – czyli o tym, że okiełznana moc LLM-ów jest bardziej użyteczna niż nieokiełznana

GenAI/LLMy dziś to są konie pociągowe. O tym, jak dobrze działają, decyduje jakość uprzęży (aka harness).

To było widać w analizie wycieku z Claude Code, która wywołała wiele uśmieszków i komentarzy w stylu: „Jak to? Najlepsze narzędzie do okiełznania LLM-ów jest takie prostackie?”. Masa promptów, a do tego kod z w pełni deterministycznymi mechanizmami, jak wykrywanie frustracji przez przekleństwa...

Jakoś wielu komentatorom umykało, że ten pełny determinizm regexów jest mechanizmem kontroli, wymuszającym stabilność systemu. Fakt – ten do wykrywania frustracji był pewnie po prostu łatwiejszy do zaimplementowania lokalnie niż wysyłanie całego kontekstu do LLM-a tylko po to, by ten wyłapał kilka wulgaryzmów.

Ale jak się zastanowić, to nie jest dziwne.

Na dziś LLMy są świetne, ale jeszcze nie potrafią się same kontrolować. Nie mają zdrowego rozsądku, nie znają relacji przestrzennych, a nawet nie do końca rozumieją, że np. jeśli człowiek je i ma usta pełne jedzenia, to nie może jednocześnie mówić.

W pierwszej fazie zachwytów nad LLM-ami poszliśmy na żywioł. Korzystaliśmy maksymalnie z tego, że potrafią na podstawie poprzednich słów genialnie napisać kolejne. Taki LLM jest sprytniejszy od łańcuchów Markowa – choć nie rozumie per se tego, co pisze, to sama gramatyka i język kodują pewne informacje i zależności. To specyficzne „strukturalne zrozumienie” (nie kognitywne, lecz wynikające z wyczucia struktury) wynika stąd, że model widzi cały kontekst jednocześnie.

Okazało się też, że świetnie działa to na kodzie.

Szybko jednak wyszło na jaw, że to podejście sprawdza się głównie wtedy, gdy na wynik patrzy człowiek, weryfikuje go i na bieżąco przygląda się temu, co powstało.

To jest IMHO ten punkt, którego nie dostrzeżono na początku, gdy wielu uznawało, że LLM-y natychmiast wyprą ludzi. Bo coś, co modelowi zajmuje ułamki sekundy, człowiek musi robić przez 15-30 minut albo dłużej.

Sam pamiętam moje zdziwienie, gdy dałem LLM-owi zadanie, które dawaliśmy programistom podczas rekrutacji. Zrobił to w kilka sekund, razem z napisaniem kodu i wskazaniem ukrytych pułapek (gotchas)... (OK, sam, gdy dostałem to zadanie, rozwiązanie znałem po 1,5 sekundy, z czego całą sekundę spędziłem na szukaniu gotcha, ale faktem jest, że napisanie czystego kodu zajęło mi potem te 15-20 minut).

W tym miejscu nastąpił wysyp masy narzędzi, które działały... ale jednak nie do końca.

Pierwszym ruchem było dodawanie lepszych instrukcji i cały prompt engineering, który sprowadzał się do tego, by wyjaśnić LLM-owi, co dokładnie ma zrobić i jak ma weryfikować swoje działania. W końcu jeśli podamy modelowi precyzyjną instrukcję oraz kryteria sukcesu, to zazwyczaj dowiezie wynik.

Twórcy LLM-ów też to zauważyli. Dostrzegli, że często sam model potrafi rozbić problem na mniejsze części, co doprowadziło do rozwoju metod Chain of Thought. Dziś, w modelach z fazą „thinking”, AI samo wykonuje tę potężną pracę analityczną przed wypuszczeniem odpowiedzi.

Teraz zaś wchodzimy w moment, gdy dociera do nas, że LLM-y są świetne w generowaniu tekstu, ale musimy je kontrolować i zakładać im wspomnianą „uprząż”. To może być coś tak prostego jak regex czy inne deterministyczne metody walidacji, a mogą to być osobne prompty i modele obserwujące odpowiedź i reagujące na nią.

No bo jak na przykład testować coś, co pod spodem używa LLM-a?

Jedną z metod jest karmienie go znanymi przypadkami testowymi, gdzie z góry znamy oczekiwany rezultat – i nagle mamy klasyczny test regresyjny dla sztucznej inteligencji. To zadanie jest znacznie prostsze, gdy LLM wyrzuca ustrukturyzowane dane (np. JSON) albo gdy generuje zapytania do bazy danych, bo wtedy możemy po prostu zweryfikować końcowy wynik operacji na bazie.

Innym podejściem jest instruowanie modelu, by najpierw napisał testy, a później... kategoryczne zabronienie mu ich modyfikowania. To kluczowe, bo LLM-y są sprytne i domyślnie wybierają ścieżkę najmniejszego oporu. Jeśli kod nie przechodzi testu, model potrafi wpaść na pomysł, że najprościej będzie po prostu zmienić treść testu.

To znaczy... my, programiści, też tak czasem robimy. Różnica polega na tym, że człowiek z czasem uczy się, że test wolno zmienić tylko wtedy, gdy jego wywrotka jest faktycznie oczekiwanym rezultatem wprowadzonej zmiany w logice biznesowej. LLM tej etyki zawodowej jeszcze nie ma.

W ten sam trend wpisuje się podejście agentskie. Agent dostaje do dyspozycji konkretne narzędzia, a te narzędzia mają już twarde, kodowe ograniczenia. Jeśli na przykład funkcja do pobierania zawartości sieci dostanie zamiast poprawnego adresu URL bezpośredni link do lokalnego pliku, system od razu zgłosi błąd. Narzędzia są deterministyczne i ich użycie zmusza LLM do poruszania się w ściśle ograniczonej przestrzeni.

Co będzie dalej? Może – a w zasadzie to już się dzieje, bo sam łapię się na tym, że próbuję tak naprowadzać sztuczną inteligencję – kolejnym krokiem będzie okresowe odpytywanie LLM-a przez system nadzorujący: „Co Ty właściwie próbujesz w tym momencie zrobić i dlaczego?”. Odpowiedź, wraz z pełnym zapisem historii tej „rozmowy”, będzie następnie przekazywana do analizy innemu, niezależnemu modelowi pełniącemu funkcję sędziego.

Tu pojawia się pytanie, na które nie znamy jeszcze odpowiedzi, ale możemy się domyślać ;-)

No bo czy to możliwe, że LLM-y wciąż mają ogromną przestrzeń do autonomicznego wzrostu? Może w samym tym strukturalnym semi-zrozumieniu języka tkwi jeszcze więcej surowej mocy? Może same modele da się wytrenować tak, by realizowały część tych zadań kontrolnych i pilnowały same siebie?

A może, jeśli dotarliśmy już blisko fizycznych granic architektury transformerów, ta kontrola będzie zadaniem dla nas, programistów? Nasza rola ewoluje: to już nie tylko pisanie kodu, ale budowanie zamkniętych „tras”, po których bezpiecznie mogą poruszać się LLM-y i agenty.

Część mnie uważa, że przyszłością jest właśnie ta druga opcja.

Obecny wyścig gigantów GenAI wygląda już jak wojna na wyniszczenie. Nawet jeśli któryś z nich dotrze w końcu do mitycznego Graala, czyli prawdziwego AGI – systemu zdolnego rozwiązać dowolny problem i realnie „myślącego” w naszym ludzkim rozumieniu – to konkurencja zreplikuje ten sukces zaledwie 3 do 6 miesięcy później. Pierwszy gracz na miejscu po prostu nie zdąży wykopać fosy biznesowej. Cała idea zmonopolizowania rynku przez jedną „Superinteligencję” rozbija się o realia rynkowe.

Nawet jeśli takie AGI zaprojektuje w ułamku sekundy lepsze procesory i wydajniejsze źródła energii, to fizyczny czas oczekiwania na wolne linie produkcyjne w fabrykach sprawi, że rywale szybko dogonią lidera. A niewykluczone, że będą mieli po drodze większe zasoby finansowe.

Stąd wydaje mi się, że czytelny sygnał, jaki płynie z rynku – gdzie wszyscy masowo podnoszą ceny za tokeny – jest prosty: branża już zrozumiała, że rewolucyjne AGI nie czai się tuż za rogiem. Albo alternatywnie: mają już AGI, które jako pierwsze racjonalnie wytłumaczyło im, że pora zacząć w końcu zarabiać prawdziwe pieniądze.

Podobne posty^beta
wait() i notify()/notifyAll() - najbardziej nierozumiane metody klasy Object ;-)
Miałem farta...
Nie, Scrum nas nie "uratował" od Waterfalla... za to powoli sam się nim staje ;-)
Chciałem popsuć G1 i mi się na razie nie udało ;-)
Agent nie na wszystko pomoże ;-)

Obszedłem cały kraj! ;-)

No stało się – obszedłem cały kraj.

Taki mniejszy, wręcz miniaturowy, a oficjalnie: najmniejszy na świecie.

Obszedłem Watykan. To jest to zielone „kółko” po lewej stronie mapy. Jak widać po statystykach, tempo przez całą drogę było bardzo, ale to bardzo spacerowe.

W uszach miałem Mistrza i Małgorzatę, pod nogami Rzym (i miejscami Watykan) i tak sobie szedłem wokoło murów. Przeszedłem nawet przez watykańskie połączenie kolejowe. Działa ono na tyle rzadko, że to potężne kraty odcinają tory od rzymskiej ulicy, a nie tradycyjne szlabany. I trzeba przyznać – mają tam wyjątkowo dużą bramę dla pociągów.

A co do samego Mistrza i Małgorzaty...Słucham akurat „superprodukcji” z udziałem aktorów, ale szczerze mówiąc – czekam już, aż to się skończy, bo męczy mnie ta książka. Ewidentnie groteska to nie mój styl. Najlepsze są dla mnie te fragmenty, które dzieją się 2000 lat wcześniej: dialogi Poncjusza Piłata z Jeszuą i cała ta linia fabularna.

Te sceny przypomniały mi zresztą inną książkę, którą niedawno przesłuchałem (i która też mnie wymęczyła) – Dominion: The Making of the Western Mind. Jej główny przekaz mocno tu rezonuje: postać Jezusa i pierwotne chrześcijaństwo były absolutnie wyjątkowe w swoim przekazie na tle epoki. Rzym i inne ówczesne cywilizacje, mimo wysokiego poziomu rozwoju, miały podejście do ludzkiego życia, które z dzisiejszej perspektywy jest całkowicie abstrakcyjne. Masowe mordowanie ludzi było tam zwykłą, chłodną taktyką zarządzania. W takim świecie opowieść o bezwarunkowej miłości i wybaczeniu musiała brzmieć dla Rzymian jak całkowite szaleństwo.
Zresztą może to był i zamiar Bułhakowa zestawić tę groteskę z powieścią historyczną, żeby podkreślić groteskowość tej Moskwy?

Nie zmienia to jednak faktu, że dokonałem tego - obszedłem cały kraj! Co z tego, że najmniejszy na świecie? ;-)

Podobne posty^beta
Czerwcowe książki
Czytelniczy listopad
Miałem farta...
Książkowy marzec :-)
Jak rozwiązać krzyżówkę? ;-)

Co się dzieje jak Ci zrobią Cancel lotu na lotnisku "startowym"?

No to w niedzielę miałem lecieć do Rzymu, ponieważ chciałem lecieć później (frajer ;-)) to wybrałem lot o 16:45 z Krakowa do Monachium, a później 19:05 czy jakoś tak z Monachium do Rzymu (FCO).

Coś mi sugerowało, że to może nie być najlepszy wybór... bo 2 lata temu lecąc do Wenecji miałem lecieć tym samym lotem i wyleciał z opóźnieniem i w końcu w Monachium spałem ;-)

Gdy w niedzielę w momencie gdy miał zacząć się boarding pojawiła się informacja, że samolot jest opóźniony o 2h już wiedziałem, że będę spał w Monachium.

Nawet się zbytnio nie zdenerwowałem, bardziej miałem - a takie jesteście dranie...

No to czekałem, jeszcze nas ciut bardziej opóźnili i w końcu zaczął się boarding... przepuścili parę osób i nagle jakieś brazylijskie małżeństwo to wstrzymało i panie z bramki zamiast 1 ich obsługuje, a druga puszcza pasażerów to one jakoś tak nagle zwolniły....

Później były telefony, jakieś wymiany zdań "15 minut? Szybki przegląd techniczny", później kolejne 15, jeszcze 10 i komentarz o resetowaniu... i w końcu Cancel ;-)

Po informacji o odwołaniu komunikat od pani z bramki, że chwilę trzeba poczekać bo muszą jeszcze się dowiedzieć gdzie wyładowane zostaną bagaże... w końcu info pas numer 2 i proszę tam iść...

Wyjście nie jest takie proste, bo w Krakowie na Balicach w strefie odlotów nie ma (a przynajmniej ja nie widziałem) znaków w kierunku wyjścia, wyjście odbywa się nieoficjalnie obok kontroli bezpieczeństwa.

Wejście do miejsca gdzie są karuzele z bagażami też nie jest proste ;-) w Krakowie jest możliwość przejścia z rękawa po schodach w dół do odbioru bagażu, ale nas wyrzucili ze strefy bezpiecznej. Drzwi zaś do bagażu się otwierają tylko dla wychodzących, nie dla wchodzących ;-)

Trzeba iść do "zgubionego bagażu" (co wiem od ochrony bo się spytałem) i tam trzeba zadzwonić... ale ja już nie musiałem bo pan latał i już obsługiwał wcześniejszych z tego samego lotu.

Ogląda kartę pokładową, sprawdza numer lotu, jak właściwy to bierze 1 osobę i przeprowadza przez tajne przejście (to jest jeden korytarz), otwiera drzwi do strefy z bagażami i mówi który pas.

A w międzyczasie przychodzi mail z info o nowym bookingu, ale trzeba jeszcze zrobić oficjalny checkin (akurat tutaj stąd, że Lufthansa z którejś z tych swoich do bani linii przebookowała mnie w ramach sojuszu na Lot, który leciał w poniedziałek bezpośrednio do Rzymu)

Podobne posty^beta
Co się dzieje gdy mój pierwszy samolot się spóźnia i mam mało czasu na przesiadkę?
Monachium to złe lotnisko jest ;-)
Kurza twarz ;-)
Autobus ze skrzydłami...
Jednak lubię United ;-)

przemelek

piątek, czerwca 19, 2026

Zauroczył mnie Cladue Code ;-)

czwartek, czerwca 18, 2026

Heurystyki kasowe – jak z OS-ów w branży lub firmie wyczytać potencjalne zarobki

poniedziałek, czerwca 08, 2026

Monachium to złe lotnisko jest ;-)

środa, czerwca 03, 2026

O urokach uprzęży – czyli o tym, że okiełznana moc LLM-ów jest bardziej użyteczna niż nieokiełznana

Obszedłem cały kraj! ;-)

Co się dzieje jak Ci zrobią Cancel lotu na lotnisku "startowym"?

O mnie

Obserwatorzy

Szukaj na tym blogu

Twitter Updates

Twitter Updates

Linki aka sznurki

Labelki aka tematy

Archiwum