LEAKED: A New List Reveals Top Websites Meta Is Scraping of Copyrighted Content to Train Its AI (Including Many Fediverse Instances!!!)
"The tech giant is sidestepping guardrails that websites use to prevent being scraped, data show, in a move whistleblowers say is unethical and potentially illegal."
ARTICLE: dropsitenews.com/p/meta-facebo…
FULL PDF: dropsitenews.com/api/v1/file/b…
INSTANCES KNOWN TO HAVE BEEN SCRAPED BY META INCLUDE:
• mastodon.social
• mastodon.online
• tech.lgbt
• hackers.town
• chaos.social
• mastodon.org.uk
• mastodont.cat
• mastodon.de
• mastodon.xyz
• mastodon.coffee
• mastodon.cloud
• mastodon.scot
• mastodonapp.uk
• mastodon.green
• mastodon.ml
• mastodon.au
• mastodon.eus
• mastodonczech.cz
• mastodon.sdf.org
• mstdn.social
• troet.cafe
• techhub.social
• tchncs.de
• kolektiva.social
• mamot.fr
• defcon.social
• meow.social
• social.linux.pizza
• ioc.exchange
• eldritch.cafe
• yiff.life
• furry.engineer
• infosec.exchange
• blahaj.zone
• woof.group
• union.place
• queer.party
• sakurajima.moe
• pawb.social
• digipres.club
• journa.host
• corteximplant.net
• corteximplant.com
• octodon.social
• bitbang.social
• jorts.horse
• tenforward.social
• pnw.zone
• spore.social
• hear-me.social
• neuromatch.social
• vt.social
• cosocial.ca
• chitter.xyz
• tooter.social
• cloudisland.nz
• social.seattle.wa.us
• masto.es
• nobigtech.es
• mastodon.gal
• masto.host
• toot.community
• pony.social
• climatejustice.global
• pleroma.envs.net
• indiepocalypse.social
• anarchism.space
• disroot.org
• dragonscave.space
• toot.bike
• fuzzies.wtf
• norden.social
• beige.party
• ohai.social
• freeradical.zone
• metalhead.club
• treehouse.systems
• icosahedron.website
• sunbeam.city
• sunny.garden
• zeroes.ca
• ursal.zone
• chaosfem.tw
• mas.to
• mathstodon.xyz
• rubber.social
• todon.nl
• cupoftea.social
• nerdculture.de
• toad.social
there're definitely more, i just did ctrl+f when i thought of an instance name so i definitely missed some. will be editing this list to add them as i think of them
нравится это
поделились этим
Ах да, забыл-ж ещё одну цитату записать сюда:
"Переходим к разделу "Культура и наука". Этот раздел у нас очень короткий, потому что мир стремительно становится бескультурным и антинаучным..." (с) @dside на позавчерашних #РегВыр
D:\side\> вообще на Регулярках напалмом жёг, выдав чуть-ли не больше перлов, чем все остальные ведущие и комментаторы вместе взятые
все ушли нв так называемую федисходку, пфф, подумаешь, не одиноко мне, я закуски купил, сока, мы с сервером и линуксфоном чувствуем себя отлично!!
ладно, на самом деле правда хорошо, я сегодня что-то прям вымотался от общения, купил себе еды, сока, побыть в одиночестве мне было немножко нужно, это радует
и вот, я ем третью самсу с сыром и ветчиной, запиваю томатным соком и завариваю доширак
я очень есть хочу и побыть в тишине
а ещё дождь спокойный идёт
мне так хорошо, я прям отдыхаю
по ребятам немножко скучаю, но я от общения за день прям устал, хотя оно вроде было в обычном темпе, странно
кароче, все звёзды для всех отлично сложились, они в приятной компании, а я в приятном одиночестве, all hail stars!!
If you accidentally share sensitive info in a post, delete it as soon as possible.
Do NOT edit it, because editing leaves the sensitive info visible in the previous versions of the edited post. (The reason previous versions are visible on edited posts is to prevent "bait and switch" abuse tactics from editing.)
If you want to keep most of the post intact when you delete it, select the "Delete & Re-Draft" option. This deletes the post but puts a copy of it into the post creation box.
Maybe an old unknown feature of #Fedilab. In settings > Privacy you can enable an option to remove UTM parameters in URLs.
It will work for new messages but you can still clear the cache from the app.
More about UTM parameters in URLs:
en.m.wikipedia.org/wiki/UTM_pa…
The app will support more tracking parameters to block in the next release. Thanks to @ePD5qRxX
codeberg.org/tom79/Fedilab/pul…
Fedilab
Fedilab is a multifunctional Android client to access the distributed Fediverse, consisting of microblogging, photo sharing and video hostingCodeberg.org
Thanks for the tip. I think a good alternative would be to allow the app to maintain the list with updates through our server to keep it up-to-date without any app updates.
@ePD5qRxX
🔧 Thinking about migrating from Mastodon to GoToSocial?
I've done it – fully documented, production tested, with real benchmarks and custom tooling.
✅ 92% less RAM
✅ 65% less storage
✅ 100% less complexity
📦 Includes slurp import, custom RSS-to-GTS bridge ("GTS-HolMirDas"), federation stats & gotchas.
👉 Read the deep dive: blog.klein.ruhr/gotosocial-rea…
#GoToSocial #GTSHolMirDas #FediFetcher #Fediverse #Selfhosting #Homelab #Migration #Mastodon #Docker
GoToSocial - ready for Prime Time?
Short answer: Hell yes. After completing the full migration and running in production for weeks, I can confidently say GoToSocial is ready for serious use.Matthias Klein
поделились этим
Good Morning, Alouette - Catching some sunrise mist in Pitt Meadows, patiently waiting for it to highlight some of the small elements.
#photography #landscape #landscapephotography #sunrise #morning #mist #river #peaceful
Andrey Esin нравится это.
поделились этим
почему то считается, что если #трамп согласится что Украина должна отдать путину донбасс, то она отдаст.
а мы это не факт совсем. посмотрим как трамп будет это все продавать.
вангую, что в конце недели вы услышите в новостях столько мерзости, сколько на все прошедшие 4 года не слышали.
@A_AnisimOFF
Не валяй дурака, Америка,
Вот те валенки – мёрзнешь, небось.
Что Сибирь, что Аляска – два берега,
Баня, водка, гармонь и лосось.
Баня, водка, гармонь и лосось.
Любэ
This was fixed in tzdata 2022b, already present in most relevant Debian versions.
I have no idea if there is some extra logic for the installer to use other time zone names; are you installing Trixie?
@WildPowerHammer well, I have encryption enabled, also dual-boot windows from hard drive and already have put some extra settings into a grub config during installation.
I guess I have to stay with grub...
1) why two separate partitions on the same disk
2) why each of them are btrfs, which has it's own subvolume capabilities
I think it should be one physical partition with btrfs and subvolumes for root, /home, ... within it.
Well, and since I set up this computer almost form zero, it's time to make an ansible playbook that will install all required packages the next time I need it.
And where I will be also able to get all the list of packages I usually install. I wanted to have this list for years...

Remmina UPD: the bug is known bugs.debian.org/cgi-bin/bugrep…
It was already fixed in Remmina but debian as usual is too slow.
I made a cursed thing: manually installed remmina, common, rdp and libsecret plugins from SID repository.
Seems to work now.
@voice > And do not forget about disabling CoW under any DB/virtual disk
Absolutely awful advice.
Disabling CoW breaks any safety btrfs provides.
At that point you might as well just use ext4 with data=journal, you'll get better safety than btrfs with CoW disabled *and* better performance. CoW is necessary for all of its data-integrity features.
@Andrey Esin
А. Тогда совсем другое дело.
Почитал тебя и понял, что соскучился по телескопу. Надо будет осенью расчехлить.
Andrey Esin нравится это.
Alado
в ответ на Alado • •contrinitiator
в ответ на Alado • • •𝙹𝚘𝚑𝚊𝚗
в ответ на Alado • • •