- A hozzászóláshoz be kell jelentkezni
- 1806 megtekintés
Hozzászólások
A FUSE meg a teljesítmény egy mondatban oximoron. Miért nem kernelmodulként oldják meg, úgy tényleg gyorsíthatna valamit.
“The world runs on Excel spreadsheets.” (Dylan Beattie)
- A hozzászóláshoz be kell jelentkezni
Kiprobaljak, optimalizaljak igy, majd ha sikeres, akkor lesz belole beepulo. Egy mostani fuse sebessege is osszehasonlithato az altaluk letrehozott-tal. Ez egy POC.
- A hozzászóláshoz be kell jelentkezni
Gondolom ami algoritmikusan nyerhető sokszorosa annak ami alacsony szintű optimalizációval nyerhető. Ez minden területen így van. Csak manapság a legtöbb terület annyira a határon van (pl. videó tömőrítés) hogy nincs más mód. Ez viszont egy relatíve új domén.
- A hozzászóláshoz be kell jelentkezni
El kéne már felejteni a fájlrendszert. Azért van az SSD-ben SoC, hogy ezt oldja meg a motorháztető alatt. Nem érdekel hogy mit hogy csinál, beküldök egy fájlt, az legyen visszaolvasható, pont.
- A hozzászóláshoz be kell jelentkezni
?
- A hozzászóláshoz be kell jelentkezni
:D
- A hozzászóláshoz be kell jelentkezni
Hülyén fogalmaztam, de a lényeg hogy ezt nem az opredszernek kéne csinálni, hanem az SSD förmvérjének, természetesen szabványosítva.
- A hozzászóláshoz be kell jelentkezni
ezt nem az opredszernek kéne csinálni, hanem az SSD förmvérjének, természetesen szabványosítva
Nem hiszem, hogy létezik, vagy hogy valaha is létezni fog olyan fájlrendszer, ami minden use case esetén képes helyt állni. Márpedig hardverbe vasalához és szabványosításhoz ilyen kéne.
Gondolj csak arra, mennyire más meta adatok kellenek Win és Linux esetén pl. (mit kezdene a Win UNIX jogosultságokkal? Vagy a Linux Win ACL-ekkel? No és hogy lehetne oprendszertől függetlenül device fájlokat létrehozni? stb.)
Aztán meg, hova mount-olnád fel azt az SSD-t? Ehhez mindenképp kell az oprendszerbe is egy gyökérkönyvtár (az mondjuk lehet ramdisk, de akkor sem úszod meg a fájlrendszerkezelést az oprendszerben).
- A hozzászóláshoz be kell jelentkezni
ezt nem az opredszernek kéne csinálni, hanem az SSD förmvérjének, természetesen szabványosítva
Ellenvélemény: minél magasabb absztrakciós szintet nyújt egy szolgáltatás, annál könnyebb benne hibát, egészen pontosan biztonsági hibát véteni. Blokkműveletekből álló interfészt könnyebb jól tervezni és implementálni mint egy (szükségszerűen magasabb szintű) file-műveletekből álló interfészt. Így minél bonyolultabb (= minél támadhatóbb) a szoftver, annál kevésbé raknám firmware-be. Inkább frissítek OS driver-t, mind SSD firmware-t.
- A hozzászóláshoz be kell jelentkezni
Nem írtál abszolút hülyeséget, mert végeredményben abban igazad van, hogy az SSD-k ma már vannak annyira gyorsak, hogy nem kell fájlrendszereket sebességre optimalizálni. Még a szutyok lassú NTFS-t is megmentik Windowson az SSD-k, pedig ott a Defender meg a Windows/File Explorer is tovább lassítja.
“The world runs on Excel spreadsheets.” (Dylan Beattie)
- A hozzászóláshoz be kell jelentkezni
amugy nem annyira elvetemult az otlet, mint lett volna ugyanez 10-20 eve.
ma mar ugye nem kell bootsectorokkal kokanyolni, az EFI megoldja egy particion fileokkal.
a particionalast sem kell OS szinten kezelni, az nvme tudja nativan mar most is.
a filerendszerek nemcsak workloadokra, hanem taroloeszkozokre is vannak optimalizalva, mas jo pl ssd-re mint hdd-re vagy tape-re. nyilvan az sem lenne baj, ha az fs figyelembe venne az ssd belso lelkivilagat, blokkmeretet (az a minimum amit egyszerre tud irni, ez az MLC-k ota altalaban eleg nagy, 64MB-ra emlexem de lehet meg tobb is a maiaknal), esetleg valamilyen belso nvram jellegu cachet is hasznalna pl a directory indexekhez, hogy pl az atime-ok ne gyilkoljak a cellakat.
meg a snapshotolast (CoW, windoznal shadow copy) is megoldhatna hardverbol, az ssd-k amugy is fizikailag mashova szoktak irni modositaskor, tehat sok melo nem lenne ezzel sem.
az OS-fuggo attribok erdekes kerdes, de valamilyen xattr-szeru mokolast lehetne amiben van egy formatum ID aztan a raw data amit az adott OS tud ertelmezni (pl. win user jogok, posix fsattr stb)
egyedul az adatmentes lenne szopo, na az nem kicsit...
- A hozzászóláshoz be kell jelentkezni
nvme tudja nativan mar most is
mar amelyik. eddig amit utobbi idoben lekerdeztem nvme-ket ott a tamogatott namespacek szama: 1
A vegtelen ciklus is vegeter egyszer, csak kelloen eros hardver kell hozza!
- A hozzászóláshoz be kell jelentkezni
esetleg valamilyen belso nvram jellegu cachet is hasznalna pl a directory indexekhez
Ilyen van pl. SD kártyákban, csak hát nem az adathordozóban magán, hanem a kontrollerben (és persze hivatalosan csakis FAT esetén működik állítólag). Figyelembe véve, hogy tényleges fájlrendszerértelmezés nincs, csak szektor kategorizálás (CMD20 speed class control: könyvtár adat, meta adat, fájl adat), igazából szerintem bármilyen fájlrendszerrel működnie kell ennek a beépített cache-nek.
- A hozzászóláshoz be kell jelentkezni
Kulcs-érték párok tárolására úgy tudom, hogy van már hardveres eszköz, erre gondolsz?
- A hozzászóláshoz be kell jelentkezni
Látom, Te is VIC-1541-es meghajtón nevelkedtél ;)
Egyébként jó a meglátás.
http://plazmauniverzum.hu <> A látható anyag 99.999%-a plazma <>
- A hozzászóláshoz be kell jelentkezni
Ha a ugyanazt a kódot egy gyors x86 futtatja, vagy egy koránt sem olyan izmos mikrokontroller, abból nem biztos, hogy jó eredmény születik.
- A hozzászóláshoz be kell jelentkezni
Ez elég erős azért így, és túl sok értelme sincs. De tegyük fel, hogy így menne, akkor szerinted varázsütésre kerülne oda az az kezelő szoftver a SoC-ba? Erős a gyanúm, hogy oda is programozó kell :D
- A hozzászóláshoz be kell jelentkezni
Ráadásul beágyazott programozó, ami valami hasonló lehet mint ennek a mosógépnek a meghajtó része:
https://www.kuvaton.com/browse/87342/pyykkipaiva5.gif
:-)
- A hozzászóláshoz be kell jelentkezni
A DeepSeek egy új Linux fájlrendszeren dolgozik
Már megint haluzik ez a fránya ChatGPT... Nem dolgozik rajta, hanem régesrég kész van, aktívan használja házon belül jóideje, most csak annyi történt, hogy publikussá tették.
- A hozzászóláshoz be kell jelentkezni
A DeepSeek github repo-jába benézve, érdekesnek találom hogy a DeepSeek-V3 teljes egészében Python-ban lett megírva.
Laikusként azt gondolnám, hogy egy ilyen számításigényes projekt mint az AI, C-ben vagy Rust-ban lesz lekódolva, hogy gyors legyen. Ezek szerint a script nyelvek tudnak valamit amit a gépi kódra fordított nyelvek nem.
- A hozzászóláshoz be kell jelentkezni
Itt inkább számít az implementált algoritmus futásideje az elemi lépések futásidejével szemben. Egyébként meg pythont is lehet fordítani ha kell.
- A hozzászóláshoz be kell jelentkezni
a számításokat gpu végzi, a mátrixműveleteket párhuzamosan ezrével gpu-nként
- A hozzászóláshoz be kell jelentkezni
Nem nagyon ertem mit mondasz vagy mit akarsz mondani. A python Pandas library-ja is C-ben irodott. Ugyanugy ahogy egy csomo mas lib. Sot maga a python interpreter is C-ben irodott.
Mit akartal mondani?
- A hozzászóláshoz be kell jelentkezni
Ezek szerint a script nyelvek tudnak valamit amit a gépi kódra fordított nyelvek nem.
Nem, nem tudnak.
A helyzet az, hogy ebben a speciális esetben a Python script csak összeállítja az adatokat és átpasszolja a GPU-nak, az igazán számításigényes részt pedig a GPU végzi és nem az interpretált Python kód. Nyilván gyorsabb lenne, ha az adatösszeállítást fordított nyelvben írnák, de nem biztos, hogy megérné, mivel nem az adatösszeállítás a szűk keresztmetszet, hanem a kiértékelése. Ez utóbbi meg ígyis-úgyis gépi kódra (GPU-ra) fordított computational shaderben van megírva.
- A hozzászóláshoz be kell jelentkezni
Így már érthető a koncepció. Adat összeállításra tényleg jobb egy script nyelv, amiben eleve adottak az erre a feladatra kidolgozott metódusok.
- A hozzászóláshoz be kell jelentkezni
mit ertesz adatosszeallitas alatt? mert azert az AI libek (tensorflow, pytorch, numpy stb) megoldjak ezt forditott nyelveken, a py igazabol csak vezerli ezeket. kivetel talan a szoveges input parsolasa, de az meg elenyeszo meretu a modelhez kepest.
pl. ha azt irod py-ben hogy y=x*a+b es ezek tensorok akkor lehet milliard parameteru matrixokkal fogja ezeket a muveleteket elvegezni a cpu/gpu-ra optimalizlat kod... erdemes a numpy-t nezegetni, mit csinal elol-hatul.
- A hozzászóláshoz be kell jelentkezni
mit ertesz adatosszeallitas alatt?
Mint írtam volt, annak a bitkolbásznak az összeállítását, ami átmásolódik a VRAM-ba, hogy aztán onnan a GPU-n natívan futó shader megcsócsálja. Ez utóbbi a számolásigényes és szűk keresztmetszet, ezért is kell hozzá kvantocsillió dolláros Nvidia hardver, hogy gyors legyen. Ehhez képest az adatok belapátolása (majd az eredmény kilapátolása) elenyésző overhead, simán belefér, hogy ezt a részt egy interpretált nyelv végezze.
matrixokkal fogja ezeket a muveleteket elvegezni a cpu/gpu-ra optimalizlat kod
...és még véletlenül sem a Python interpreter hajtja végre, ezért nem számít, hogy szkriptnyelv vagy fordított nyelv végzi-e az adatösszeállítást, mert a lényeg, a műveletvégzés úgyis a GPU-n fut. Pontosan erről van szó.
Egy időben játszottam azzal, hogy hogyan lehet megerőszakolni úgy a shadereket, hogy számítást végezzenek computational shader nélkül (mivel a CUDA proprietary és hardverspecifikus, ellenben az OpenGL nyílt és általánosan elérhető sokféle kártyán és oprendszeren). Simán működik, annyi a hátránya csak, hogy az egyik shadert (én a fragment shadert használtam erre) úgy kell megírni, hogy csak átmásolja az adatokat. Computational shader esetén ez a plusz másolás kimarad, egyébként semmivel sem gyorsabb. Ez a fajta hákolás aztán okafogyottá vált, amikor kijött a Vulkan, mert abban már a computational shaderek is szabványosítva vannak és video kártya függetlenek.
- A hozzászóláshoz be kell jelentkezni