Утечка исходников Яндекса

Некоторая занимательная статистика по утекшим исходным кодам Яндекса. О том где и как искать их в этом посте не будет ни слова, просто голая статистика. Итак поехали!

Архивы и файлы

Какие в утечке есть архивы, количество файлов и размер в распакованном виде.

ArchiveFilesSize
aapi.tar142344.56 KiB
admins.tar17 379209.31 MiB
ads.tar51 7561.63 GiB
alice.tar71 2881.80 GiB
analytics.tar6 199379.43 MiB
antiadblock.tar5 534152.20 MiB
antirobot.tar2 02154.59 MiB
autocheck.tar81287.56 KiB
balancer.tar4 817226.07 MiB
billing.tar38 083896.92 MiB
bindings.tar8512.63 MiB
captcha.tar198862.20 KiB
cdn.tar2201.65 MiB
certs.tar8284.63 KiB
ci.tar8 13723.60 MiB
classifieds.tar430 51110.41 GiB
client_analytics.tar73444.66 MiB
client_method.tar1464.37 KiB
cloud.tar85 092697.97 MiB
commerce.tar9 487132.16 MiB
config.tar30841.14 KiB
connect.tar17 95625.84 MiB
crm.tar16 861212.80 MiB
crypta.tar21 48059.85 MiB
customer_service.tar7976.30 KiB
datacloud.tar1 3564.35 MiB
delivery.tar1 1548.27 MiB
direct.tar113 481453.68 MiB
disk.tar25 672252.84 MiB
docs.tar3 76662.41 MiB
drive.tar23 221372.10 MiB
extsearch.tar38 896879.44 MiB
frontend.tar671 77319.79 GiB
fuzzing.tar76022.75 KiB
gencfg.tar1 36325.53 MiB
groups.tar1 290142.70 KiB
helpdesk.tar2391004.17 KiB
infra.tar170 201675.87 MiB
intranet.tar38 692236.94 MiB
investors.tar1 24429.53 MiB
it-office.tar89414.33 KiB
jupytercloud.tar8181.80 MiB
kernel.tar10 384220.28 MiB
library.tar18 111143.26 MiB
load.tar3 260148.36 MiB
mail.tar73 900604.99 MiB
maps.tar207 1364.06 GiB
maps_2.tar19 339165.50 MiB
maps_adv.tar4 18815.55 MiB
market.tar746 3399.03 GiB
metrika.tar80 9591.94 GiB
mobile-WARNING-notfull.tar253 3533.94 GiB
nginx.tar8183.14 MiB
noc.tar34 3292.01 GiB
partner.tar33 815138.75 MiB
passport.tar37 994561.73 MiB
pay.tar4 50827.57 MiB
payplatform.tar3 284290.95 MiB
paysys.tar2 45724.96 MiB
portal.tar120 4394.89 GiB
privacy_office.tar92181.14 KiB
products.tar53106.72 KiB
robot.tar25 764931.73 MiB
rt-research.tar4 874581.09 MiB
saas.tar6 11552.14 MiB
sandbox.tar47 466180.25 MiB
search.tar59 9531.69 GiB
security.tar10 764242.01 MiB
skynet.tar7762.73 MiB
smart_devices.tar20 5771021.98 MiB
smarttv.tar5381.69 MiB
solomon.tar15 751101.01 MiB
stocks.tar4683.18 MiB
switch.tar3221.42 MiB
tasklet.tar1 0672.19 MiB
taxi.tar759 40012.49 GiB
tools.tar7 42058.00 MiB
travel.tar93 414378.34 MiB
wmconsole.tar12 35059.23 MiB
yandex360.tar73 7291.43 GiB
yandex_io.tar4 59746.02 MiB
yaphone.tar1 4797.12 MiB
yawe.tar2783.99 MiB
Total4 685 11186.97 GiB

По распакованному размеру видно, что в компании не так уж плохо с кодом — косвенно, отношение размера сжатых исходников (44.7 Гб) к распакованному размеру, свидетельствует о копипасте в коде — здесь это всего 1 к 2, что очень круто для текстовых файлов, коими являются исходные коды. Я честно говоря, ожидал распакованного размера в районе 200−300 Гб.

Статистика по расширениям файлов

Здесь приводится информация о первой тысяче расширений не длиннее 20 символов (есть и больше). Пустые расширения не в счет, на первом месте неожиданно java, но на самом деле если сложить вместе js и ts — то фронтенд будет на первом месте.

Смотреть
#ExtensionCount
11 153 943
2java280 671
3py259 637
4png243 053
5js239 353
6ts213 919
7json169 727
8gz136 287
9yaml129 713
10cpp126 813
11h125 097
12tsx124 798
13make118 026
14yml110 451
15kt90 786
16go82 769
17sql78 953
18xml75 422
19md71 187
20css63 216
21scala57 350
22svg46 198
23hpp42 916
24swift40 795
25txt34 986
26conf24 724
27jpg23 350
28c22 769
29sh21 716
30html20 940
31scss20 442
32proto19 720
33styl18 230
34csv16 396
35ext9 874
36m9 712
37imageset9 328
38info9 226
39php8 204
40gif7 834
41sls7 208
42ogg6 893
43cs6 108
44ipynb5 966
45pm5 845
46properties5 714
47webp5 655
48d5 604
49pdf5 493
50resx5 455
51yql5 405
52cc5 403
53net4 802
54i18n4 781
55zip4 444
56jsx4 200
57symlink4 109
58pem3 867
59j23 726
60pl3 535
61xsl3 497
62snap3 330
63t3 184
64sqlt3 097
65tsv2 848
66stub2 835
67ru2 770
68inc2 713
69tf2 368
70cfg2 313
71tjson2 278
72tpl2 257
73less2 213
74pcss2 191
75tgz2 127
76yson2 095
77mp32 063
78out2 060
79border2 020
80in1 990
81loc1 943
82bemhtml1 920
83s1 879
84ico1 753
85gradle1 711
86sass1 648
87ttf1 602
88psql1 593
89xlsx1 580
90q1 562
91bin1 552
92lua1 548
93groovy1 400
94migr1 378
95woff1 377
96dll1 369
9701 361
98woff21 295
99rst1 204
100gpg1 203
101jpeg1 191
102idl1 160
103mustache1 130
104yate1 128
105xsd1 122
106plist1 091
107nlg1 080
108mdp1 064
109feature1 046
110ini1 042
111nlu1 011
112map1 005
113flow1 000
114wav996
115fstr996
116fpair995
117blocks994
118factors976
119jinja974
120matrixnet972
121ics965
1223964
123hbs959
124strings935
125examples926
126lproj925
127template921
128tmpl-specs911
1291906
130jinja2887
131kts864
132assets847
133meta837
134test836
135cmake835
136gsm832
137backend825
138dart807
139jsonl802
140mdx794
141defs790
142tmpl778
143patch771
144list765
145eot744
146typings742
147tt2725
148wiki722
149const716
150am702
151upstream702
152grnt701
153colorset699
154install696
155service693
156source673
157tcc667
158vcxproj665
159production659
160pyx654
161bazel634
1622632
163text620
164mk602
165rb600
166mod593
167podspec582
168entries572
169bundle568
170pyi567
171config564
172testing556
173po543
174eml541
175registry536
176cshtml535
177toml526
178jar524
179pcap516
180postinst513
181data505
182xib491
183priv-i18n484
184bash482
185pb480
186as463
187logrotate457
1884448
189autotest445
190pro443
191led427
192bat426
193crt418
194override417
195fbs408
196m4406
197ld400
198datasource398
199tests397
200sum396
201autoupdate394
202log383
203miff383
204get381
205dirs380
206ownership378
207vcproj372
208lock372
209ftl364
210mm363
211class363
212yml_357
213S351
214htm322
2155313
216props313
217msg312
218sgml312
219storyboard304
220markdown303
221ssqls297
222example296
223iml295
224gzt293
225xcassets292
226sc289
227xcscheme286
228asm283
229cm282
230gemini279
231mo277
232components277
233load266
234pxd265
235xcconfig264
2366262
237key261
238vue257
239modulemap248
240utils248
241sample239
242dockerfile237
243nib237
244xls236
245cnf235
246attr235
247ex234
248csproj233
249schema230
250dat229
251order229
252ps1225
253Debian225
254lst224
255aug219
256ftlh219
257filters218
258ejs218
259ans217
260md5217
261hcl216
262MB214
263cu212
264mp4210
265framework204
266nginx204
267blackbox203
268so203
269cxx191
270a189
271xcodeproj186
272desktop186
273pbxproj185
274storyshot181
275spec181
276dbf179
277expected177
278all177
279inl176
280sln176
281pub174
282shx172
283shp172
2848170
285rc169
286bcmap168
287org166
288ru_3333161
289switch159
290Dockerfile159
291ru_3334159
292dita158
293roll158
294url157
295rul155
296swf152
297default151
298modules151
2997151
300svelte151
301init150
302preinst149
303enc149
304mak149
305env148
306mock144
307db143
308otf143
309cron143
310wkt142
311prototxt140
312dsp140
313mako139
314hh138
315gztproto135
316postrm133
317wsdl133
318tile132
319control131
320com130
321mobile130
322external129
323stdout128
324exports127
325features126
326bson123
327cuh123
328x121
329cmd120
330swiftdoc119
331R119
332psd119
333whl119
334check118
335appiconset116
336xlsm115
337graphql115
338hooks114
339em113
340tokens113
341autopkg112
342jrxml109
343cl109
344ipp109
345pkl108
346vm107
347dist105
348drawio103
349include102
350def100
351cbm100
352stable100
353prerm99
354hjson99
355pattern99
356trie96
357lint96
358diff96
359haml96
360lib95
361dat_94
362script94
363opts94
364icf92
365puml92
3663gr92
367ev91
368unstable90
369awk90
370pyc89
371v487
372helpers87
373v686
374docs86
375MD86
376publish86
377erb85
378targets85
379har85
380pch85
381der83
382types82
383fbs6481
384stencil81
385rs80
386tag80
387dot79
388sbt79
389xacro79
390local78
391old77
392sq77
393delta76
394jsonnet74
395tar74
396vsprops73
397http73
398972
399xs72
400zpl72
401cache70
402commands70
403stress69
404vert69
405mat68
406frag67
407tif67
408standards67
409docx67
410encrypted67
411aspx66
412dump66
413ie66
414links66
415jks66
416secrets66
417srv64
418jsp64
419webm63
420pas63
421xslt63
422mb63
423factories61
424i18n_list61
425rl661
426disabled61
427pump61
428tbl61
429ac61
430doc61
431xaml60
432stderr59
433xcsettings58
434pgc57
435upstart57
436pp57
437pug57
438monrun57
4391057
440nnet56
441mmp56
442opus56
443txt_56
444cfgproto56
445PL56
446pod56
447yandex56
448res55
449s355
450ru_334055
451twig54
452i54
453tskv54
454svc54
455dataset54
456js-i18n53
457sn53
4580053
459protobuf53
460vsd52
461launch52
462raw52
463secret51
464tfvars51
465nlg_51
466postdl51
467test_basic50
468function50
469tmp49
470unittest49
471inline49
472common49
473libyaml48
474v248
475cgi48
476rtf48
477texi48
478TXT47
479MockMaker46
480tr46
481headers46
482gn46
483dfm45
484base45
485substvars45
486libsonnet45
487tt45
488ui45
489geojson45
490windows44
491jst44
492ddp44
493preprod43
494resolved43
495invalid42
496dox42
497binary42
498scenario42
499options41
500v141
501query41
502dpkg-new41
503mjs40
504resjson40
505type40
506bundles39
507git-id39
508bmp39
509dict39
510sqlite39
511bzl38
512ttar38
513swg37
514rules37
515pbtxt37
516wmi36
517rss36
518fnt36
519MIF36
520MID36
521bmh36
522svcinfo36
523ammo36
524deb36
525rmr36
526lockfile36
527mid36
528mif35
529keystore34
530npy34
531flth34
532bpmn34
533zk33
534pth33
535getPromo33
536prod33
537keys33
538parquet33
539prestable33
540urdf32
541prj32
542liquid32
543jsonschema32
544asc32
545cv32
546sreq31
547req31
548hosts31
549TIF31
550bb31
551creq31
552authz31
553sts31
554exe31
555fb31
556remove31
557psgi30
558spdata30
559mmap30
560pptx30
561rl30
562tiles30
563flm30
564stop30
565ru_334230
5661129
567bak29
568astub29
5691228
570graphml28
571c2p28
572xhtml28
573depend28
574g428
575plantuml28
576pbm28
577tk28
578ora27
579response27
580remorph27
581gni27
582apns27
583eps27
584pfx26
585v326
586nupkg26
587args26
588fix26
589version26
590gpx26
591xpm25
5921325
593pot25
594jasper25
595fp25
596pkg25
597cur25
598MF25
599backup24
600kml24
6011424
602sha124
603avro24
604wsd24
605coffee24
606consts24
607qcr23
608gz_errors23
609locale23
610iss23
611l23
612ua23
613apk23
614raml23
615binmode22
616touch22
617hocs22
618ascx22
619dsw22
620dsk22
621heic22
622scsd22
623featureset22
624dof22
625sdp22
626gnu22
627y22
628dpr22
629settings21
630yqlt21
631sub21
632guess21
633JPG21
634get_site21
635vcp21
636dev21
637ru_334121
638base6421
639daily21
640rviz21
641keydata21
642obj21
643cjs20
644kz20
645TTF20
646csr20
647tiff20
6480420
649ogv20
650odt20
651ods19
652fig19
653converted19
654c2n19
655cql19
656fio19
657rake19
658gemspec19
659htc19
660aidl19
661smime19
662o19
663ditamap19
664transfer18
665pcm18
666supp18
667cbproj18
668accept18
669grammar18
670rar18
671iptables18
672graffle18
673ztgt18
674scled18
675deps18
676by18
677tfstate18
678saql18
6791618
680svcmap18
681crc17
682cer17
683cf17
684canon17
685scroll17
686db-shm17
687gunicorn17
6881917
689dtd17
690db-wal17
691EX17
692trusty17
693tap17
694xenial17
695cue17
696sqm16
697moveNotes16
698tftpl16
699yapf16
700gv16
701mms16
702xctestplan16
703stl16
704gql16
705wds16
706head16
707pbxbtree16
708weather16
709perfmonmk16
710arctest16
711hw16
712foot16
713get_points16
714new16
715hxx16
716exclude16
717ngx16
718test_15
719webpart15
7201515
721phar15
722typed15
723bz215
724BUILD15
725mon15
726man15
727yasm15
728bytes15
729localhost15
730clj15
731ydb15
732xcf15
733zdsproj15
734tags14
735pkcs1214
736tab14
737id14
738messages14
739XML14
740pbuf14
741name14
742jade14
743tex14
744afm14
745prefs14
746lck14
747core14
748save14
749material14
750crl14
751md_14
752qbk14
753own14
754ai14
755glsl14
756jmx14
757pyt14
758pref14
759aar14
760pfb14
761network14
762blacklist13
763vc13
764pbtext13
765tfevents13
766sv13
767conf-load13
768p1213
7692213
770crx13
771repo13
7722013
773sandbox12
774phpt12
775ru_b_12
776chromium12
777pdb12
778CSV12
779manpages12
780debhelper12
781jng12
782agi12
783io12
784rmt12
785re12
786cpg12
787tla12
788vrt12
789noload12
790private12
791ru-timings12
792win12
793sysconfig12
794linkcmd12
795chyt12
796table12
797context12
798netdev12
799oneshot12
800layout12
801public12
802fmt11
803ent11
804sudoers11
805ie811
8062711
807icns11
808comp11
809biathlon11
810yaml-corp11
811vim11
812powerpc11
813maps11
814xinstall11
815z11
8162511
817custom11
818example-0111
819ctmpl11
8201711
8211811
822adssm11
8232311
824grants11
825bashrc11
826dfa11
827remap10
828hnw10
829inf10
830pack10
831jsonp10
832perfmon10
833action10
834time10
835search10
836footprint10
837ioc10
838egg-info10
839sighup10
840m4a10
841ttml10
842snapshot10
843asp10
844bcc10
845nuspec10
846gs10
847container10
848my_ip10
849portal10
850dmp10
851dlv10
852car10
853user10
854sport10
855math10
856bemtree10
857b649
858219
859ubuntu9
860playground9
861changes9
862package9
863stpd9
864dsl9
865slice9
866build9
867add9
868root9
869pde9
870api9
871simple9
872focal9
873beta9
874xjb9
875timer9
876msvc9
877ep9
8787z9
879yuv9
880passwd9
881sed9
8822649
883pbsn9
884swp9
885diff-tests9
886v9
887loadtest9
888manifest9
889lucid9
890drl9
891ast9
892mq9
893main9
894ivaine19
895zfpproj9
896dia9
897auth9
898sp9
899trans9
900dir8
901node8
902us8
903museums8
904mds8
905names8
906ivaine28
907vsdx8
908etalon8
909pickle8
910TS8
911248
912dSYM8
913queries8
914run8
915lark8
916chsql8
917wizqbundle8
918ru_33398
919nodeubic8
920tBroken8
921wxs8
922psycho8
923il8
924orig8
925metro8
926autotests8
927jl8
928empty8
929persons8
930crash8
931next8
932cppy8
933dssm8
934ewp8
935good8
936mobile_pay8
937panoramas8
938quotes8
939bbappend8
940sofa8
941268
942colors8
943flags8
944libvpx8
945rdf7
946tpl~7
947rc27
948tikaite7
949deploy7
950symbols7
951chk7
952connect7
953supervisor7
954el7
955gen7
956jsons7
957tyaml7
958gdb7
959traffic7
960orc7
961screens7
962pg7
963getPosts7
964token7
965dfu7
966p7b7
967dist-info7
968link7
969conf_7
970ftj7
971chtml7
972ch7
973ready7
974yo7
975ko7
976java_7
977json-load7
978hourly7
979index7
980cloud-prod7
981sqlite37
982cerr7
983507
984state7
985mysql7
986xdiff7
987Tests7
988wat6
989306
990property6
991uz6
992coord6
993sm6
994cb6
995thrift6
996profile6
997redhat6
998debian6
999password6
1000selector6

Интересно, а используется ли Rust в Яндекс

#Archive with 'rs' extensionCount
1market.tar52
2noc.tar27
3travel.tar1
Total80

Фактически нет, так, на уровне поиграться :(

Ну а как насчет C#?

#Archive with 'cs' extensionCount
1crm.tar287
2maps.tar219
3market.tar2 544
4metrika.tar1
5mobile-WARNING-notfull.tar14
6noc.tar57
7portal.tar155
8taxi.tar2 831
Total6 108

Тоже негусто, — в общем что Rust что .NET разработчики Яндексу не нужны (это мне интересно со своей колокольни).

Технологии/язык

Ну и напоследок сгруппируем (весьма условно), расширения по технологиям (все что не попало в категории не учитывается), и вот что получается:

#Technology/LanguageCount
1Config/Data716 898
2Web/Frontend705 888
3Java435 795
4Image345 255
5C/C++323 189
6Python266 257
7Archive143 175
8Documentation119 899
9Database89 392
10Go82 769
11Swift40 795
12Shell26 532
13Template11 016
14PHP8 204
15.NET6 651
16Certificate5 244
17Fonts4 999
18Perl3 535
19Multimedia3 279
20Assembler2 162
21Lua1 548
22Ruby600
23Rust80
2023-02-12 20:48:46 UTC analyze hacking leak sources statistic yandex