Akisamb

joined 1 year ago
MODERATOR OF
[–] Akisamb@programming.dev 2 points 2 months ago

Tu as des subsides pour la LAMAL. Pour vivre à 1300 tu es obligé de les utiliser.

Je confirme 1300 c'est obligatoirement une colocation ou en couple et tu ne vas jamais au restaurant.

Mais à 4000 tu n'as plus toutes ces contraintes. Quand j'ai touché 3600 CHF pour la première fois j'avais vraiment l'impression d'être riche. Je pouvais aller au restaurant tous les jours, partir à l'autre bout de l'Europe sur un coup de tête etc...

[–] Akisamb@programming.dev 1 points 2 months ago (4 children)

4000 balles et c’est la galère avec ça

Faut pas abuser, j'ai vécu il y a 3 ans avec 1300 balles par mois à Lausanne et c'était pas si juste que ça.

4000 tu as une assez bonne qualité de vie.

J'ajouterai que ça dépend des cantons, je connais des gens dans le Valais qui ne gagnent que 2800 CHF par mois en travaillant a plein temps (41h semaine).

[–] Akisamb@programming.dev 1 points 3 months ago

It's great for making images to associate with language learning flashcards.

[–] Akisamb@programming.dev 9 points 3 months ago (5 children)

They've got thunderbird which is as far as I know the only serious alternative to outlook.

[–] Akisamb@programming.dev 1 points 4 months ago (1 children)

Pas forcément d'accord pour les 1,4 milliards pour la Seine. A ma connaissance il n'y a pas eu de mesures d'urgence et temporaires. Toute l'infrastructure va rester en place.

Après c'est vrai que ça coûte 140 euros par habitant d'Ile de France, ce qui n'est pas négligeable. Mais de la a appeler ça un caprice.

[–] Akisamb@programming.dev 3 points 4 months ago

Ton article parle d'autre chose. Il parle de l'année 2023 par rapport à l'année 2022. La on compare le premier semestre 2024 au premier semestre 2023.

J'ai répondu par rapport au secteur de l'industrie dans un autre commentaire, pour ce secteur là ça semble être une bonne chose. Pour les autres secteurs en forte baisse, je n'ai pas fait d'analyse, mais il n'y a pas de raison que cette baisse soit liée à des choses négatives. Par exemple une grosse partie des réductions sont dues à un hiver clément.

Le seul point noir, c'est les transports. On sait très bien comment réduire les émissions, vu que la demande est élastique par rapport au prix. Mais plus personne n'osera mettre en place une taxe CO2 (merci les gilets jaunes). Le RN promet même de retirer les taxes sur l'essence (quitte même à ne pas respecter les règles de l'UE), histoire qu'on soit encore plus dépendant des dictatures.

[–] Akisamb@programming.dev 4 points 4 months ago (1 children)

Peut-être pour la baisse de 5% des émissions de l'industrie. Mais pas pour les autres secteurs.

C'est aussi possible qu'il n'y ait pas eu de baisse dans l'industrie. Ton article parle de faillite d'entreprises, ce qui ne veut pas dire une cessation d'activité économique, juste que le propriétaire a perdu son argent.

Le premier exemple de ton article, je la connais bien. C'est Ascometal, j'ai suivi la saga avec Marsactu. L'usine continuera de produire après sa reprise avec juste l'arrêt de l'activité du fil. L'entreprise racheteuse va aussi investir pour ajouter un four électrique pour réduire l'impact carbone de l'entreprise.

Ce qu'il faudrait regarder c'est la production industriel, qui est assez stable :

La production du premier trimestre 2024 est légèrement supérieure à celle du premier trimestre 2023 dans l’industrie manufacturière (+0,4 %) comme dans l’ensemble de l’industrie (+0,3 %).

[–] Akisamb@programming.dev 6 points 5 months ago

Depuis janvier 2021, il est conseiller politique auprès de la délégation générale de La République en marche. Jérôme Peyrat est condamné en 2020 pour violences conjugales sur son ancienne compagne, ce qui le conduit à renoncer à sa candidature aux élections législatives de 2022.

Il finit par se représenter aux élections législatives anticipées de 2024 malgré les polémiques que sa candidature lève

Le petit filou, il a attendu qu'on l'oublie. Je ne comprends pas pourquoi les partis politiques tiennent autant à garder ces éléments.

[–] Akisamb@programming.dev 6 points 5 months ago

Now instead of just querying the goddamn database, a one line fucking SQL statement, I have to deal with the user team

Exactly, you understand very well the purpose of microservices. You can submit a patch if you need that feature now.

Funnily enough I'm the technical lead of the team that handles the user service in an insurance company.

Due to direct access to our data without consulting us, we're getting legal issues as people were using addresses to guess where people lived instead of using our endpoints.

I guess some people really hate the validation that service layers have.

[–] Akisamb@programming.dev 1 points 5 months ago* (last edited 5 months ago) (1 children)

En même temps, pas très malin d'utiliser le dog whistle <>.

Ce qui sous entend au pire un génocide et au mieux la situation des juifs de l'Algérie après la libération.

Assez surpris que LFI l'ait accepté. Après les républicains ont bien Meyer Habib.

[–] Akisamb@programming.dev 3 points 5 months ago

Ça fonctionne bien, ça m'a bien mis Volt comme premier choix.

[–] Akisamb@programming.dev 2 points 6 months ago (1 children)

Explication alternative, un procureur de la république peut porter plainte d'office,c'est-à-dire sans qu'il ait été saisi par la victime.

 

abstract :

How do sequence models represent their decision-making process? Prior work suggests that Othello-playing neural network learned nonlinear models of the board state (Li et al., 2023). In this work, we provide evidence of a closely related linear representation of the board. In particular, we show that probing for "my colour" vs. "opponent's colour" may be a simple yet powerful way to interpret the model's internal state. This precise understanding of the internal representations allows us to control the model's behaviour with simple vector arithmetic. Linear representations enable significant interpretability progress, which we demonstrate with further exploration of how the world model is computed.

 

Paper here : https://arxiv.org/pdf/2312.00752.pdf

Abstract :

Foundation models, now powering most of the exciting applications in deep learning, are almost universally based on the Transformer architecture and its core attention module. Many subquadratic-time architectures such as linear attention, gated convolution and recurrent models, and structured state space models (SSMs) have been developed to address Transformers’ computational inefficiency on long sequences, but they have not performed as well as attention on important modalities such as language. We identify that a key weakness of such models is their inability to perform content-based reasoning, and make several improvements. First, simply letting the SSM parameters be functions of the input addresses their weakness with discrete modalities, allowing the model to selectively propagate or forget information along the sequence length dimension depending on the current token. Second, even though this change prevents the use of efficient convolutions, we design a hardware-aware parallel algorithm in recurrent mode. We integrate these selective SSMs into a simplified end-to-end neural network architecture without attention or even MLP blocks (Mamba). Mamba enjoys fast inference (5× higher throughput than Transformers) and linear scaling in sequence length, and its performance improves on real data up to million-length sequences. As a general sequence model backbone, Mamba achieves state-of-the-art performance across several modalities such as language, audio, and genomics. On language modeling, our Mamba-3B model outperforms Transformers of the same size and matches Transformers twice its size, both in pretraining and downstream evaluation.

 

Was looking at EAP6 release notes and was pleasantly surprised to see this there.

I'm quite happy that intellij provides on premise solutions, it gives a small chance of this coming to my job one day. I believe this will be quite useful for repetitive code and certain types of tests.

 

cross-posted from: https://kbin.social/m/machinelearning/t/98088

Abstract:

Work on scaling laws has found that large language models (LMs) show predictable improvements to overall loss with increased scale (model size, training data, and compute). Here, we present evidence for the claim that LMs may show inverse scaling, or worse task performance with increased scale, e.g., due to flaws in the training objective and data. We present empirical evidence of inverse scaling on 11 datasets collected by running a public contest, the Inverse Scaling Prize, with a substantial prize pool. Through analysis of the datasets, along with other examples found in the literature, we identify four potential causes of inverse scaling: (i) preference to repeat memorized sequences over following in-context instructions, (ii) imitation of undesirable patterns in the training data, (iii) tasks containing an easy distractor task which LMs could focus on, rather than the harder real task, and (iv) correct but misleading few-shot demonstrations of the task. We release the winning datasets at https://inversescaling.com/data to allow for further investigation of inverse scaling. Our tasks have helped drive the discovery of U-shaped and inverted-U scaling trends, where an initial trend reverses, suggesting that scaling trends are less reliable at predicting the behavior of larger-scale models than previously understood. Overall, our results suggest that there are tasks for which increased model scale alone may not lead to progress, and that more careful thought needs to go into the data and objectives for training language models.

 

Hyena Hierarchy seems to aim to be a drop-in replacement for attention : https://arxiv.org/pdf/2302.10866.pdf

It looks good on paper, but I haven't been able to find anybody using it in a model. Does anyone have an example of a code or implementation ? Is there really a big improvement on long context lengths ?

view more: next ›