Avatar
iamkexo
48d1811d1e160f88b5084e854d874d88ed6a9443ba9560e1d9130309dab44d69
I like foss
Replying to Avatar Fabio Akita

Finalmente voltei a reconfigurar um setup de gerador de imagens estilo Dall-e ou Midjourney, mas que roda localmente no meu PC. Tenho uma RTX 4090 pra isso mas roda com outras GPUs também, o lance é sempre ter o máximo de VRAM quanto possível.

Mas é um saco bagunçar a máquina com um tanto de venv de python e tudo mais. O ideal é usar Docker. Começa instalando o NVIDIA Toolkit pra Docker igual este tutorial:

https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html

Com isso Docker tem acesso a GPU agora. Daí é só configurar um docker compose e eu achei esta imagem pra subir:

https://github.com/mmartial/ComfyUI-Nvidia-Docker?tab=readme-ov-file

Só ler o README e seguir o que ele fala. Ele vai subir a interface web ComfyUI, que é a melhor hoje em dia e tem um estilo de Nodes e Workflow pra programar a geração de imagens. Pra quem é de Da Vinci Resolve ou Blender, é parecido.

Finalmente, mesmo os modelos abertos de Stable Diffusion sendo muito bons, eles ainda tem aqueles problemas de imagens de I.A. de mais de 5 dedos nas mãos, aparecendo uma terceira perna do nada, e não conseguindo escrever nenhuma palavra direito.

Mas aí tem o pulo do gato. Saiu um novo modelo aberto mais avançado, o FLUX. Depois de ter o ComfyUI funcionando, é só continuar seguindo este outro tutorial pra saber de onde baixar e onde instalar Flux:

https://comfyanonymous.github.io/ComfyUI_examples/flux/

E é isso aí! Com isso posso gerar imagens que um Dall-e/ChatGPT se recusa a gerar, e com a vantagem de ter menos halucinações e até com textos. Veja a imagem de exemplo abaixo como o texto aparece nítido e legível.

Já usava o comfy ui no docker com outros modelos, mas não conhecia esse 'FLUX'. Vou ser obrigado a data uma testada

Replying to Avatar Fabio Akita

OpenAI lança o novo modelo O1 hoje, 12/09. O primeiro demo que ele apresenta nas redes sociais é o O1 conseguindo fazer um pequeno joguinho (muito, muito simples, coisa de um único arquivo com um único page down, não fiquem emocionados!)

No Dia do Programador? Coincidência? I think not! 😂

Preparem-se que todo jornalista tá super emocionado de novo. Eu fiz pequenos testes preliminares e vou dizer que não senti tanta mudança assim comparado com o 4o anterior. Sim, parece que ele gasta mais tempo em passos intermediários, tentando quebrar problemas complexos em problemas menores, pra ver se consegue uma solução melhor. É o que chamam de "chain-of-thought". E de fato, pra certos tipos de problemas, parece melhor mesmo.

A idéia do nome "O1" parece ser um "soft-reset". Não vai mais chamar "ChatGPT 4" ou "ChatGPT 5", vai recomeçar do "OpenAI O1", então vez o próximo seja "OpenAI O2"?

Minha teoria da conspiração pessoal (coloquem chapéu de alumínio), é que eles entendem o "peso" que seria lançar "ChatGPT 5". Eu venho falando isso faz tempo: uma versão 5 teria que ser ordens de grandeza superior ao 4, de uma forma que qualquer pessoa comum consiga ver a diferença.

Se falharem em lançar um "5" superior, eles arriscam explodir a bolha de I.A. Por isso eu sinto essa "relutância". Notem que eles travaram no 4. Tentaram sair com "4o" e agora "O1", mas nada de "5". Não querem se comprometer, mas também não podem deixar todo mundo esperando pra sempre.

É uma saída de marketing. O O1 parece mesmo superior ao 4o, mas benchmarks não servem pra nada. Você pode simplesmente enviesar o treinamento pra fazer passar melhor em testes de benchmark. O lance são testes reais.

E em testes de código, eu não senti tanta diferença em relação ao 4o. Lógico, tem que testar mais tempo, com problemas mais diversos, por enquanto é só uma anedota. Mas de novo, não senti nenhuma grande diferença pra justificar jornalista falando "isso vai mudar o mundo!!" e toda essa emoção.

Até peguei um textão de um jornalista e passei pelo O1 pra ver o que ele acha. Alguns trechos que achei engraçados:

O1: "Check OpenAI's official channels to confirm the release of "OpenAI-01" or "o1" and gather accurate details about its capabilities."

OpenAI precisa começar a treinar os modelos pra saberem seus próprios nomes e características pelo menos. Eles nunca sabem!

O1: "Benchmark Results: Re-examine the reported benchmark performances, such as the 83% score on the International Mathematics Olympiad (IMO) and the Elo rating of 1807 in coding competitions. Ensure these figures are accurate and sourced from credible evaluations.

Comparisons with Human Experts: While it's notable if the model performs similarly to PhD students on challenging tasks, it's important to contextualize this achievement and acknowledge any limitations."

O próprio O1 manda tomar cuidado quando se fala de benchmarks e não assumir "uau, é mais inteligente que um PhD do MIT"

O1: "AGI Timeline: Exercise caution when predicting the arrival of Artificial General Intelligence (AGI) by 2025. Acknowledge the speculative nature of such predictions and the ongoing debates within the AI community."

Obviamente, jornalista emocionado de novo falando "AGI está perto" e o próprio O1 pelo menos tem bom senso de falar pra baixar o tom.

O1: "Avoid Hyperbole: Statements like "It will change the world" and "It's a day to celebrate" may come across as overly enthusiastic. Strive for a neutral tone that presents facts and lets readers form their own opinions.

Balanced Viewpoint: Acknowledge any limitations, ethical considerations, or areas where further development is needed."

Achei super legal que o O1 avaliou o tom do jornalista como entusiástico demais, pra ser mais neutro e pra explicar também as limitações e áreas de melhoria. Até a porr de uma GenAI tem mais bom senso que um jornalista médio. Tá foda.

Testem vocês mesmos e me digam o que acharam: sentiram muita diferença em relação ao 4o?

https://openai.com/o1/

Doidera que desde o início tem essa discrepância entre o que o modelo realmente consegue fazer e o que um jornalista fala que o modelo consegue fazer.

Isso já tá muito chato, especialmente porque de vez em quando eu tenho um amigo que só teve contato com a matéria de algum jornalista e comprou a ideia de que a IA vai dominar o mundo e aí meu me sinto obrigado a explicar os motivos do porquê isso não é verdade...

Everything Everywhere All at Once needs to be at least on the top 3

Por qual motivo vocês aqui usam Nostr?

Só curiosidade mesmo, é pela privacidade, por não ter censura, ou tem algum outro motivo?

Wow, I thought that nostr was not susceptible to these types of attacks... At least they happen less often now.

Replying to Avatar Derek Ross

if your nostr client doesn't support deletes, you can use this web application to delete your content: https://nostr-delete.vercel.app

you'll need to have a nostr web browser extension installed to proceed. i like Alby or Nostr Connect.

there are two caveats with this tool.

1) this will only work for relays that support NIP-09 deletes. *most* relays do support deletion, but some may not.

2) caching services or applications that use them may hold onto your content until that cache expires.

Glad to know that, I have just begun to learn what nostr is and knowing that some clients do not support deletion and that I have an alternative is very helpful!

Thank you!

Eu uso GrapheneOS em um Pixel 8, mas já usei diversas ROMs customizadas, com root, sem root, vanila, MIUI, com firmware customizado...

Enfim, se quiser bater um papo eu estou a disposição!