Nostr Web Client

Finalmente voltei a reconfigurar um setup de gerador de imagens estilo Dall-e ou Midjourney, mas que roda localmente no meu PC. Tenho uma RTX 4090 pra isso mas roda com outras GPUs também, o lance é sempre ter o máximo de VRAM quanto possível.

Mas é um saco bagunçar a máquina com um tanto de venv de python e tudo mais. O ideal é usar Docker. Começa instalando o NVIDIA Toolkit pra Docker igual este tutorial:

https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html

Com isso Docker tem acesso a GPU agora. Daí é só configurar um docker compose e eu achei esta imagem pra subir:

https://github.com/mmartial/ComfyUI-Nvidia-Docker?tab=readme-ov-file

Só ler o README e seguir o que ele fala. Ele vai subir a interface web ComfyUI, que é a melhor hoje em dia e tem um estilo de Nodes e Workflow pra programar a geração de imagens. Pra quem é de Da Vinci Resolve ou Blender, é parecido.

Finalmente, mesmo os modelos abertos de Stable Diffusion sendo muito bons, eles ainda tem aqueles problemas de imagens de I.A. de mais de 5 dedos nas mãos, aparecendo uma terceira perna do nada, e não conseguindo escrever nenhuma palavra direito.

Mas aí tem o pulo do gato. Saiu um novo modelo aberto mais avançado, o FLUX. Depois de ter o ComfyUI funcionando, é só continuar seguindo este outro tutorial pra saber de onde baixar e onde instalar Flux:

https://comfyanonymous.github.io/ComfyUI_examples/flux/

E é isso aí! Com isso posso gerar imagens que um Dall-e/ChatGPT se recusa a gerar, e com a vantagem de ter menos halucinações e até com textos. Veja a imagem de exemplo abaixo como o texto aparece nítido e legível.

iamkexo 1y ago

Já usava o comfy ui no docker com outros modelos, mas não conhecia esse 'FLUX'. Vou ser obrigado a data uma testada

Replying to

Fabio Akita

OpenAI lança o novo modelo O1 hoje, 12/09. O primeiro demo que ele apresenta nas redes sociais é o O1 conseguindo fazer um pequeno joguinho (muito, muito simples, coisa de um único arquivo com um único page down, não fiquem emocionados!)

No Dia do Programador? Coincidência? I think not! 😂

Preparem-se que todo jornalista tá super emocionado de novo. Eu fiz pequenos testes preliminares e vou dizer que não senti tanta mudança assim comparado com o 4o anterior. Sim, parece que ele gasta mais tempo em passos intermediários, tentando quebrar problemas complexos em problemas menores, pra ver se consegue uma solução melhor. É o que chamam de "chain-of-thought". E de fato, pra certos tipos de problemas, parece melhor mesmo.

A idéia do nome "O1" parece ser um "soft-reset". Não vai mais chamar "ChatGPT 4" ou "ChatGPT 5", vai recomeçar do "OpenAI O1", então vez o próximo seja "OpenAI O2"?

Minha teoria da conspiração pessoal (coloquem chapéu de alumínio), é que eles entendem o "peso" que seria lançar "ChatGPT 5". Eu venho falando isso faz tempo: uma versão 5 teria que ser ordens de grandeza superior ao 4, de uma forma que qualquer pessoa comum consiga ver a diferença.

Se falharem em lançar um "5" superior, eles arriscam explodir a bolha de I.A. Por isso eu sinto essa "relutância". Notem que eles travaram no 4. Tentaram sair com "4o" e agora "O1", mas nada de "5". Não querem se comprometer, mas também não podem deixar todo mundo esperando pra sempre.

É uma saída de marketing. O O1 parece mesmo superior ao 4o, mas benchmarks não servem pra nada. Você pode simplesmente enviesar o treinamento pra fazer passar melhor em testes de benchmark. O lance são testes reais.

E em testes de código, eu não senti tanta diferença em relação ao 4o. Lógico, tem que testar mais tempo, com problemas mais diversos, por enquanto é só uma anedota. Mas de novo, não senti nenhuma grande diferença pra justificar jornalista falando "isso vai mudar o mundo!!" e toda essa emoção.

Até peguei um textão de um jornalista e passei pelo O1 pra ver o que ele acha. Alguns trechos que achei engraçados:

O1: "Check OpenAI's official channels to confirm the release of "OpenAI-01" or "o1" and gather accurate details about its capabilities."

OpenAI precisa começar a treinar os modelos pra saberem seus próprios nomes e características pelo menos. Eles nunca sabem!

O1: "Benchmark Results: Re-examine the reported benchmark performances, such as the 83% score on the International Mathematics Olympiad (IMO) and the Elo rating of 1807 in coding competitions. Ensure these figures are accurate and sourced from credible evaluations.

Comparisons with Human Experts: While it's notable if the model performs similarly to PhD students on challenging tasks, it's important to contextualize this achievement and acknowledge any limitations."

O próprio O1 manda tomar cuidado quando se fala de benchmarks e não assumir "uau, é mais inteligente que um PhD do MIT"

O1: "AGI Timeline: Exercise caution when predicting the arrival of Artificial General Intelligence (AGI) by 2025. Acknowledge the speculative nature of such predictions and the ongoing debates within the AI community."

Obviamente, jornalista emocionado de novo falando "AGI está perto" e o próprio O1 pelo menos tem bom senso de falar pra baixar o tom.

O1: "Avoid Hyperbole: Statements like "It will change the world" and "It's a day to celebrate" may come across as overly enthusiastic. Strive for a neutral tone that presents facts and lets readers form their own opinions.

Balanced Viewpoint: Acknowledge any limitations, ethical considerations, or areas where further development is needed."

Achei super legal que o O1 avaliou o tom do jornalista como entusiástico demais, pra ser mais neutro e pra explicar também as limitações e áreas de melhoria. Até a porr de uma GenAI tem mais bom senso que um jornalista médio. Tá foda.

Testem vocês mesmos e me digam o que acharam: sentiram muita diferença em relação ao 4o?

https://openai.com/o1/

iamkexo 1y ago

Doidera que desde o início tem essa discrepância entre o que o modelo realmente consegue fazer e o que um jornalista fala que o modelo consegue fazer.

Isso já tá muito chato, especialmente porque de vez em quando eu tenho um amigo que só teve contato com a matéria de algum jornalista e comprou a ideia de que a IA vai dominar o mundo e aí meu me sinto obrigado a explicar os motivos do porquê isso não é verdade...

Replying to

Max DeMarco

If you would have 24hours to leave your home buy a plane ticket and start a new life in another country.

Where would you go?

iamkexo 1y ago

I would definitely go to Switzerland!

Replying to

Lyn Alden

What are some of the best movies of the past five years?

iamkexo 1y ago 💬 1

Everything Everywhere All at Once needs to be at least on the top 3

iamkexo 1y ago 💬 7

Por qual motivo vocês aqui usam Nostr?

Só curiosidade mesmo, é pela privacidade, por não ter censura, ou tem algum outro motivo?

Replying to

plebiANON

I have admitted I was wrong about so many things since first going down the food rabbit hole, the Bitcoin rabbit hole, and re-finding my faith. I would encourage those of you who firmly believe a mainstream consensus belief to really go down those rabbit holes, and see if you come out believing the same thing. I see a lot of Bitcoiners (I was one of these people) realize they were lied to about the money, and just stop there. You’ve been lied to about almost everything your whole life. Start challenging your shibboleths and actually begin progressing into a wiser individual.

iamkexo 1y ago

That's actually helpfull advice.

Replying to

fiatjaf

I just typed "rm -rf *" by accident.

iamkexo 1y ago

understandable

Replying to

Vitor Pamplona

Lots of real cases. Some stuff still happens today, but it is much less these days.

iamkexo 1y ago

Wow, I thought that nostr was not susceptible to these types of attacks... At least they happen less often now.

Replying to

Derek Ross

if your nostr client doesn't support deletes, you can use this web application to delete your content: https://nostr-delete.vercel.app

you'll need to have a nostr web browser extension installed to proceed. i like Alby or Nostr Connect.

there are two caveats with this tool.

1) this will only work for relays that support NIP-09 deletes. *most* relays do support deletion, but some may not.

2) caching services or applications that use them may hold onto your content until that cache expires.

iamkexo 1y ago

Glad to know that, I have just begun to learn what nostr is and knowing that some clients do not support deletion and that I have an alternative is very helpful!

Thank you!

Replying to

Vitor Pamplona

We moved to make it private because showing you disliked someone usually escalates. If they are skilled, they start making bots and hit you with 1000s of DMs, replies, quotes from random accounts to annoy you.

Keeping it private solves the problem without creating more problems.

iamkexo 1y ago 💬 2

Was that decision made because of a real case?

Replying to

Takeshi Koa

Olá pessoas! Gostaria de saber se aqui existe algum chat ou comunidade que fala especificamente sobre Custom Rom's e derivados. Caso não, vocês teriam algum link do telegram ou outro app de comunicação? Grato.

iamkexo 1y ago

Eu uso GrapheneOS em um Pixel 8, mas já usei diversas ROMs customizadas, com root, sem root, vanila, MIUI, com firmware customizado...

Enfim, se quiser bater um papo eu estou a disposição!