ipsace i tiskace

roj.bloguje.czesky!

25.12.2008

Mazací hlava

Rubrika tiskace
Známka 0 (0)
Při jakémkoliv mazání bychom měli používat hlavu. Zajímavý seminář o tom měl nedávno v Berouně guru nejpovolanější, David Lynch. Pojďme si teď popovídat o tom, jak, a zda vůbec, mazat za použití hlavy.

V dávných dobách, které mnohé z mladých programátorek ani nepamatují, byla cena za uložení jednoho bitu informace o tři až čtyři řády vyšší, než dnes. Byla tak astronomická, že s ní musely počítat i firmy, nabízející služby na Internetu. Přesto i v těchto ztížených podmínkách existovaly free služby a poskytovatelé našli obchodní model, aby se jim jejich poskytování vyplatilo.

První takové služby, které se přirozeně nabízely, byly free-emaily. Weblogy a fotogalerie si na svou existenci musely ještě pár let počkat, o YouTube ani nemluvím. Úložný prostor byl vzácný, proto byla kapacita schránek velmi malá, v řádu megabajtů. Poskytovatelé též neměly zájem, aby si jedna uživatelka vytvářela více účtů, protože to znamenalo ztrátu – násobné náklady při konstantním marketingovém výnosu (1 osoba). Proto bylo logické a ekonomicky nutné, aby se data, která pro poskytovatele negenerovala žádný zisk, mazala.

Povšimněme si jedné důležité vlastnosti. Email je striktně individuální služba. Slouží jen a pouze své uživatelce, nikdo jiný do ní nemá (za normálních okolností) přístup. Kromě toho jej uživatelka využívá denně, popřípadě pokaždé, když se připojí k Internetu. Bez toho služba pozbývá smyslu.

S vědomím tohoto snadno vymyslíme strategii, kterou bychom šetřili diskový prostor. Uživatelka, které se delší dobu na svůj email nepřihlásila, o něj s vysokou pravděpodobností již nemá zájem, je tedy zbytečné, aby blokoval kapacitu úložiště. Pro jistotu jí ještě včas pošleme varovný předexpirační email, který, pokud službu skutečně hodlá používat, prostě nemůže nedostat. Pokud ani pak nezareaguje, účet zrušíme. Risiko, že si tím vytvoříme nepřátelsky naladěnou zákaznici, je minimální, a nikoho dalšího se toto smazání nedotkne.

Free-emaily to takto skutečně od počátku praktikovaly a praktikují i dnes. Expirační doba byla typicky půl roku, trend spíš vede k prodlužování.

Přišla doba weblogů. Situace je se diametrálně změnila. Blogísek totiž funguje úplně jinak. Jeho autorka nemusí mít potřebu jej navštěvovat pravidelně. Může otěhotnět a porodit, odjet na delší dobu do ciziny, může prostě jen nemít potřebu něco napsat, kluka už přes blog sbalila. Přesto má její blogísek smysl. Pro ni samotnou a, na rozdíl od free-emailu, pro její čtenářky!! Pokud poskytovatel její blog z jakéhokoliv důvodu smaže, vyrobí si jednu hodně naštvanou autorku a několik desítek až tisíců naštvaných čtenářek. A analogicky i nefunkčních odkazů po celém světě. Jaký důvod má firma k vytváření takto negativní reputace? Kritérium neaktivity, které mělo kdysi smysl u free-emailů, je u dnešních blogů zcela nesmyslné.

Ne, nepodezírám vás, že patříte mezi zastánce tohoto přežitého paradigmatu, vy ne :-) Přesto můžeme o mazání blogů uvažovat i dál. S rozumem v hrsti.

Mazat či nemazat?

Splog
Spam blog. Falešný weblog, který je vytvořen pouze za účelem tvorby odkazů, neboli black-hat SEO

Ačkoliv existují i zastánci zásady nemazat nic (odb. "suchá cesta", angl. "lubricant-free"), já mezi ně nepatřím. Existuje totiž obsah, který může být z jakýchkoliv důvodů škodlivý pro svého poskytovatele. Může například porušovat zákon, autorská práva a podobně. Tam je situace jasná. O něco méně zřejmý je fenomén splogů. Splogy by poskytovateli teoreticky vadit nemusely, ale jejich vinou může u poskytovatele dojít k penalizaci u Googlete a dalších vyhledavačů. Kromě toho balastní obsah může zdržovat čtenářky od nalezení toho, co si chtějí přečíst.

Zkrátka, připustme, že existuje obsah, jehož mazání je žádoucí, a to bez ohledu na to, zda je tento obsah čerstvý, či zda na serveru leží jakkoliv dlouho. Povšimněte si toho. Stáří je zcela irelevantní!.

Za zcela nepoctatný důvod k mazání dnes naopak považuji místo na disku. Jednak v současné ekonomické realitě má vyšší hodnotu disk s daty než disk bez nich. Za druhé to, že se něco smaže, nemusí znamenat, že se nějaké místo uvolní. Záleží na způsobu ukládání dat. Levnější a rychlejší může být disk prostě přikoupit, než data fysicky mazat a přeorganisovávat. Pokud by přesto byla disková kapacita úzkým hrdlem, lze učinit opatření na straně vstupu, tedy zakázat obrázky a videa, nastavit maximální objem dat za den, týden...

Závěr z toho plynoucí: Normální je nemazat, mazat se má pouze škodlivý obsah. Tím se nám problém zúžil na pouhé definování a detekci škodlivého obsahu. Jak toto konkrétně zařídit? To je na delší konstruktivní diskusi. Mě samotného napadají jen dílčí návrhy. První se týká pojistky.

Dvoustupňové mazání (two-level cum)

Obsah, který je shledán nevyhovujícím, se v první fázi přestane zobrazovat. Tedy jakési smazání na zkoušku. Místo toho se čtenářce zobrazí oznámení, že blogísek byl smazán (+důvod) a na této stránce bude možnost požádat o obnovení. Tato možnost bude dána nejen majitelce blogu, ale komukoliv. Provozovatel serveru tak získá tu nejlepší možnou zpětnou vazbu, může si vyžádat důvody pro obnovení. Následně vše vyhodnotí (licky nebo strojově) a blog obnoví.

Teprve pokud první fáze trvá jistou dobu bez reakce, může dojít i k druhé fázi, kdy se blog neobnovitelně smaže a adresa se uvolní případným dalším zájemcům.

Tato metoda zajistí téměř stoprocentně, že lictvo nepřijde o nic, o co stojí. Autorky se nebudou bát takovému serveru svěřovat svá nejniternější přání a server se stane hvězdou mezi blogovadly, neb všichni nejlepší sem přemigrují. Pravděpodobnost, že vznikne naštvaná seriosní uživatelka, bude limitně nulová.

Doba expirace může být variabliní podlě "stupně škodlivosti", viz dále.

Detekce 2.0

Tady se mohou teoretičky a amatérské socioložnice vyřádit. Pojďme do toho :-)

Každý blogísek může ihned po svém založení dostat nějakou počáteční úroveň. Třeba 3. Postupně se mu tato úroveň může snižovat či zvyšovat. Například dosáhne-li čtyřky, již mu nehrozí smazání. Bude-li na jedničce, nastane první fáze smazání. Zvyšovat level nemusí nutně jen admini, může se dak dít i automaticky, třeba návštěvností (po vyjmutí robotů)

Aby vše neleželo na bedrech zaměstnankyň provozovatele, je žádoucí vytvořit hierarchickou komunitu uživatelek, které si server budou spravovat samy. Každá dosáhne jisté adminské úrovně a její hlas tak získá větší či menší váhu v hodnocení blogů. Uživatelka s vysokými právy pak může splog a jiný evidentně škodlivý obsah poslat k ledu ihned, například nastavením levelu blogu na -1. Je mi jasné, že zde neříkám nic nového, tyto principy jsou známé dlouho a existují i na bloguje.cz. Snad? Nevím.

Všimly jste si jedné maličkosti? Nikde jsem nezmínil žádné vyhodnocování doby nepřihlášení. Proč taky? Ovšem pro příznivce tohoto způsobu mám radostnou zprávu. Ano, možná by to bylo rozumné u blogů, které mají několik málo příspěvků a autorka se přestala přihlašovat, snížit po určíté době level o jeden stupeň. Pak i o druhý, ale v každém případě zachovat dvoustupňové mazání! Bez aktivního potvrzení některou z privilegovaných uživatelek by se prostě nic samo od sebe nesmazalo navěky bez varování.

Důležité je, aby nikde v nízkých vrstvách serveru nestrašila hrozba automatického mazání, která se ve vyšších vrstvách podmíněně deaktivuje. To v praxi vede k průšvihům, čehož jsme byli svědky. Adminka tohle neuhlídá. Musí tomu být naopak. Normální je nemazat.

roj, 25.12.2008, 17:39:00, trvalý odkaz,

Komentáře (8)

Varování:
Budu zde nechávat jen komentáře, které se mi líbí. Demokracie je sen. Nechte si o ní zdát :-)
1 Já tomu nerozumím muris 25.12.2008, 17:45:57
a to jsem dneska mazala hlavu docela solidně! Tedy z vnitřku :-)
2 Roj WWW 25.12.2008, 18:25:40
Muris, u tebe bych si o suche ceste nedovolil uvazovat ani na okamzik :-)
3 David Grudl [openID] Mail WWW 25.12.2008, 20:13:08
Článek v plném rozsahu podpisuji. http://www.latrine.cz...-a-podepsat

Jen doplním pár poznámek:

ad místo na disku: pokud má bloguje 4500 blogů, odhaduji, že bude mít cca 225000 příspěvků (snažil jsem se o co nejlepší odhad, tak snad nejsem moc mimo). Vzhledem k objemu dat třeba La Trine soudím, že datový objem všech příspěvků by neměl přesáhnout 200 MB. Zároveň tipuji, že datový objem komentářů může být až 20x větší. I kdybych se ve svých odhadech hodně seknul, určitě se bloguje.cz vejde na běžný disk v ceně do 1000 Kč.

Úzké hrdlo ale vidím jinde. Arthur systém v době vzniku koncipoval pro desítky blogerů. Aplikace koncipovaná pro desetitisíce blogerů se píše úplně jinak. Pokud nikdy nedošlo ke kompletnímu přepsání celé aplikace (rozuměj: nikdo to nechtěl zaplatit), tak skutečně počet rozhoduje a výkonu a to v podstatě přímou úměrou.

A přidám argument, proč mazat: Tím je omezený prostor jedinečných identifikátorů, tedy názvy blogů. Zaregistrovat dnes jakoukoliv pětiznakovou doménu .com je prakticky nemožné. Aby nebyly všechny zajímavé nebo krátké (roj) názvy zablokovány spekulantem, je potřeba spekulanty mazat.
4 Ferda Pytlík 25.12.2008, 21:56:58
měně plkat a více dělat by prospělo všem, včetně Roje, Misantropa (viz "moudra" na jeho blogu) a dalších myslitelů.
David Grudl se mýlí v několika věcech:
1) ceny disků se vyvíjejí rychleji, než služby ISP.. nelze srovnávat, ale lze se z toho poučit.
2) úroveň zabezpečení dat v ISP je principielně jiná než u single disku nelze srovnávat a ani jednoduše migrovat
3) úzká hrdla se u databází začínají projevovat v úrovních, které Bloguje ještě nedosáhlo. Proto je argument celkem nesmysl.
4) spekulantů, kteří by těžili z registrací na bloguje.cz a bylo by jich více než malé množství není tolik aby to byl argument k plošnému mazání,

5) marketing firmy Laar je víceméně průhledný, ovšem nutno říci že současně taky ne moc úspěšný.
To jak si s tím Laar poradí je jeho věc, aktuální info z NetMonitoru říká, že za poslední měřitelné období mělo Bloguje celkem jasný propad v návštěvnosti. Co to znamená pro jejich marketingové zájmy, nechť si zpracuje každý sám.

Většina lidí z principu neustoupí ze své ideologie ať už je jakkoliv blbá, jen na ní ex-post budou donekonečna vymýšlet argumenty proč ji obhajovat. To se ostatně stává jak Misantropovi, tak Rojovi, tak jiným lumenům.

Většina si taky naivně myslí, že jakmile objeví mechanismus stlačitelnosti a efektivizace čehokoliv, tak ten jeho mechanismus platí stále, třebaže se předpoklady k jeho aplikaci dávno změnily. Tuto změnu pak myslitel popisuje jako chybu vnější, technickou, nikoliv chybu jeho přístupu nebo formy metodiky. Což je ovšem opět jeho zásadní omyl.

Zdraví Vás hybrid Ferdy mravence a Brouka Pytlíka = Ferda Pytlík, komentáře a rozumy všeho druhu.
5 Johnny [openID] Mail WWW 25.12.2008, 22:35:39
Dovolím si poznamenat, že autor článku opomněl jeden z nejdůležitějších faktorů, proč bloguje.cz maže blogy - a tím je snaha odlišit se od ostatních blogovacíh portálů, které sice mají mnohonásobně více blogů, nicméně kvalitní obsah je rozmělněn do několik málo těch, které jsou opravdu ke čtení. A sám Roj na to byl svého času hrdý - v nejednom článku to zmínil...
V tom případě JE pro bloguje.cz normální mazat. Argument, že místo na disku skoro nic nestojí je sice pravdivý, ale v dané situaci lehce zavádějící.
Přeci nikdo z nás nechce mít knihovnu plnou knížek, které nečte - jen proto, aby měl kilometry knih. A pokud ano, nedělá to pro sebe, ale na odiv ostatním a pak taková knihovna ztrácí svůj původní význam (a...ano... jistě je levnější koupit pár prken na police než se týden přehrabovat v knihách a jednu po druhé buď nechat nebo vyřadit). Lepší je takové knížky domů vůbec nenosit. Knihovnu možná nebudu mít největší ze všech, ale nebude v ní brak, bude se v ní lépe hledat a bude aktuální.
6 Roj WWW 25.12.2008, 22:50:24
[3] Dik za podpis, jen ho prosimte nikdy neodvolavej :-))
[4] HmmmmmmMM! hezke, hezke...
Ferdo, asi do toho vidis, ale do jedne veci ne. Moje ideologie je nebyt ideolog, ale pragmatik :-) Jako dukaz poslouzi komentar [5], ktery jsem opravdu nepsal ja sam. Driv jsem si vazne myslel, ze mazani je prima, ale kdyz PRAXE ukazala, ze pak zmizi blogy Alky, Angely a dalsi perly, kvuli kterym bylo Bloguje kdysi na vrcholu, pochopil jsem, ze je to kravina na entou a jiz zadne argumanty ex-post nevymyslim. Jen si me nekdy precti :-)
7 David Grudl WWW 26.12.2008, 00:47:54
[3]

> David Grudl se mýlí v několika věcech:
1) ceny disků se vyvíjejí rychleji, než služby ISP.. nelze srovnávat, ale lze se z toho poučit.

Jelikož David Grudl nikdy nežekl, že služby ISP se vyvíjejí rychleji než ceny disků, předpokládám, že i zbytek komentáře je nesmyslný blábol a číst jej nebudu.

[5] Já to vidím jako přednost stále. Ale netušil jsem až donedávna (impulsem bylo smazání Alky), jak jsou pravidla nastavena.
8 Lokutus WWW 30.12.2008, 13:47:57
Hezky's to Roji vymyslel. Tak teď ještě uvést to do praxe. Už se těším na nový, luxusní, Rojův blogovací serverrrrrrr. :-)

Přidání komentáře...

zde vpište
bloguje.cz
Získejte Seamonkey!
Valid XHTML 1.0 Strict