Author Archives: Honza

HDFS Node Manager: FATAL Error in dispatcher thread

When your HDFS Node Manager does not start for no apparent reason (such as following one), solution is simple: check free space on your disk. Node Manager gets nervous when there is less than 10 % of free disk space and may not work properly or at all.

Source: my very own experience :)

Ambari service “Start” including “Start all” are greyed out

You might run into mentioned situation after Hadoop cluster or node reboot. Solution is quite simple: Ambari agent is apparently not running on each node or at all.

Start it with following command:

In case your are unable to access your Ambari web interface at all (you wouldn’t be able to see previous error, but who am i to judge you), start your Ambari server as well:

Source: Apache Ambari documentation

Služební cesty: nedobrovolným poutníkem na kraj světa a občas i zpět

Definice

Služebka, business trip, nebo prostě jakýkoliv jiný výlet, kdy za cizí peníze obětujete vlastní zdraví i rozum. Pěkně korporátně, kde jsou jasná pravidla a procesy, které se ale stejně jasně dají otáčet, ohýbat, nedejbože i obejít. Čistě subjektivní obrázek, neeticky generalizující, genderově i politicky nekorektní. Tedy skoro přesně tak jak se mi to vydralo na mysl – kde jinde, než v 28000 stopách nad naší matičkou zemí.

 

Rychlost

Většina služebních cest nezačíná důkladným plánováním, jak by bylo ideální – ale spíše následujícím stylem:

“V Chorvatsku je průser, neměl bys čas to tam na místě pořešit?”
“Mno, jak to spěchá a co o tom všechno víme?”
“Nevíme nic a ideální by bylo, kdybys tam už zítra ráno byl – jenom na pár dní, víš jak…”

Automaticky vás naskočí, že to bude alespoň na týden. Týden kdy přibrzdíte veškerou práci tady a budete se věnovat aktivitám na místě. Dle vaší seniority a aktuálních projektů můžete zkusit říci ne. Občas je to i zapotřebí – ale většinou se podvolíte, protože sezením na zadku zkušenosti nenaberete.

Nikdo nemá rád zachraňování průšvihů – protože vypadat jako hrdina přilétající na bílém Airbusu by chtěl sice každý, ale ironie života je nemilosrdná. Spíše to tak zavání pošramocenou reputací díky namočení se do projektu, který byl už od začátku odsouzen k nemilosrdnému konci. Failu, průseru, katastrofě, kde se všechna vstřícná gesta otočí proti vám, až se budou hledat viníci.

 

Čas

Vše rozhodnuto, jede se a je potřeba to naplánovat, na blind se v korporátu nejezdí. Po vyřešení toho co se na místě bude dělat, kdo bude za co zodpovědný (což je vlastně triviální problém v životě obchodního cestujícího) začíná ta pravá sranda: Nejprve letenky, hotel, doprava – ale pozor, ne abyste to hned koupili! Nejprve všechno sepsat do interního systému, nabudgetovat a poslat na schválení. V závislosti na rychlosti vašeho schvalovatele máte různou šanci na to, že koupíte vyjmenované věci za původně nalezené ceny. A není toho málo, musíte počítat s letenkou, hotelem, taxi v Praze, taxi v cílové destinaci, případný pronájem auta, mýtné, parkovné, diety, nějaký ten oběd se zákazníkem (a nedejbože abyste ho neměli schválený ve speciálním systému!).

Čas má velice nepříjemnou vlastnost: je relativní. Zatímco vaše rodina bude doma odpočítávat hodiny do vašeho příjezdu, vy budete v jednom zápřahu celý den a večer na hotelu namísto odpočinku řešíte jiné projekty, které se mezitím rozjely ve vaší domovině.

S relativitou času je zapotřebí počítat už při plánování: když budete trávit dva dny na služební cestě, budete mimo dny čtyři. Jasně, že do Frankfurtu dorazíte za hodinku – ale ranní vstávání, cesta na letiště, security, boarding, pojíždění po dráze, cesta z letiště, ubytování na hotelu. A najednou z hodinového letu máte celkem 4 zabité hodiny. Čtvrt dne, který byste mohli strávit jinak.

 

Letiště, váš druhý domov

Plánování je hotovo, vydáváte se na cestu. V rámci efektivity berete brzké ranní lety, což znamená vstávání extrémně brzy. Venku je pošmourno, nikde nikdo – i Vietnamská večerka má ještě zavřeno. Taxík naštěstí přijíždí přesně a vy můžete na chvíli vypnout. Praha je perfektně průjezdná, cesta ubíhá, taxi nadskakuje na kolejích za Vypichem a vy víte, že za chvíli už jste v tom.

Příjezd, platba, rozloučení a hurá do terminálu. Check-in netřeba, už málokdy berete zavazadlo k odbavení. Zvlášť když na delších cestách můžete využívat hotelovou prádelnu – následná agilita s malým kufrem je pak k nezaplacení. Krátká rozvaha na security o délce jednotlivých front, propracovaná choreografie s vybalováním kufru stejně jako Clooney v „Up in the air“ a přijdete si jako největší profík. Ale i ten největší profík se v tom ranním rozpoložení sekne: zapomenuté hodinky na ruce pískají na celé okolí a falešná aura profesionála se rázem rozplývá.

Čekáte a čekáte – ať to naplánujete sebelépe, stejně čekáte. Letadla se honí jen v amerických filmech a málokomu stačí vizitka „dvě minutky a stihnul bych to“. Zmeškání letu znamená alespoň půldenní prodlevu a to si dovolí málokdo. Neefektivní čas si krátíte simulací práce (neb v tom ruchu stejně nic neuděláte), nebo jen tak čumíte do zdi. Stejně je ještě šest ráno, půlka mozku ještě spí a ta druhá předstírá činnost jako poslanci během prvního čtení zákona.

Boarding – všichni se hrnou dopředu, ale vy víte, že letadlo se bookuje odpředu a vaše letenka v zadní části letadla vám takřka garantuje odstup od ostatních cestujících při boardingu i za letu. Místa vzadu mají i další výhody: ocas letadla je alespoň teoreticky nejbezpečnější místo při případné havárii, během letu máte skvělý výhled na mechanizaci křídla a hlavně vám poskytuje nejlepší zvukový zážitek. Nikoliv klid, ale hluk: prvních pár vteřin startu, kdy slyšíte to nejkrásnější burácení motoru s více jak 100 kN tahu – to je pocit, pro který se do letadla vyplatí vracet.

Ale nepředbíhejme – ještě následuje zavření nákladních vrat, což provází intenzivní zvuk kovového lupnutí, které zvlášť u starších Airbusů dokáže vylekat nejednoho pasažéra. Bezpečnostní instruktáž, miniprostor, kde se ukáže aktuální nálada stevardů. Bude to dnes pruda, nebo naopak ležerní styl?

Pilot nahazuje motory, letadlo je vytlačeno ze stojánky a během toho všeho nastává něco, co nezasvěcenému zní jako párek nosorožců, který si užívá milostné radovánky kdesi v zavazadlovém prostoru. Hrkání se zintenzivňuje a frekvence se zvyšuje, až po desítkách vteřin dozní do ztracena. Vyrovnávání tlaku v hydraulickém systému je samozřejmě zajímavé, ale proč při jeho interpretaci nepopustit trochu uzdu fantazii. Zvláště když se to celé opakuje po vypnutí motorů na stojánce.

Konečně je to tady, magický okamžik kdy letadlo vyletí z oparu, mraků či jiného marastu a ukáže se vám jen nádherný výhled. Sluníčko dvanáct měsíců v roce, v noci mléčná dráha i jasně viditelné metropole, co září jak houby v Černobylu.

Při přistání je to přesně naopak, nejprve se z toho krásného prázdna ponoříte do mraků a v šedivém obláčku spálených pneumatik se dostáváte zpět na zem. Podle umu pilota si můžete odnést i zhmožděnou sedací část – vše zcela zdarma během několika málo vteřin.

Pak vidíte jen rozepínání pásů, otevírání binů a nervózní stání v uličce než otevřou dveře = to vše pokud možno ještě před tím, než letadlo opustí ranvej. A všichni namáčknutí jeden na druhého stojí a hledí jak surikaty, ačkoliv by mohli ještě několik minut v klidu sedět – věc kterou nikdy nepochopíte, ať už letíte kterýmkoliv směrem.

 

Práce

Paradoxně ta nejsnazší část z celé cesty. Pokud nejste sebevrah, pravděpodobně víte, do čeho jdete a obor nejspíš zvládáte. Jinak byste přeci seděli doma s mnohem menším rizikem. Rozdíly oproti práci doma jsou zásadní: potencionální průšvih je nadnárodního charakteru a tak tomu dáváte 150 % úsilí, neboť nechcete vypadat jako debil. Práce na místě, práce v hotelu, práce pomalu i ve spánku.

Zdaleka nejhorší na nečekaných služebkách je to, že vám práce “doma” stojí a snažíte se ji dodělávat po večerech na hotelu. To má za následek méně spánku, hůře odvedenou práci na služebce, více dohánění po večerech a tak pěkně dokolečka.

Ještě horší variantou je tzv. parašutismus. Ten spočívá v rychlém výsadku, naslibování všeho možného a následný útěk „za jinými projekty“. V dlouhodobém měřítku na tom tratí všichni. Zákazník nedostává, co mu bylo slíbeno a ten chudák, co řešení dodává bude brečet nad tím, že očekávání byla nastavena setsakra vysoko.

 

Hotel

Asi jeden z největších zdrojů mylných představ o služebních cestách a s tím spojené závisti. Jasně že budete pravděpodobně bydlet ve čtyř nebo pětihvězdičkovém hotelu v centru města (neboť vám jiné systém ani nenabídne a rezervace mimo systém vyžaduje neúprosné papírování), ale není to taková výhra, jak by se mohlo zdát.

Důvod je jednoduchý: vaše okolí si bude představovat, jak spíte na obrovské posteli, pravidelně navštěvujete saunu, objednáte snídani na pokoj, chodíte na masáž a po pár laškovných větách obšťastníte všechny místní servírky.

Realita je ale naprosto jiná – prvním důvodem je cena: za hotel díky výhodnějším smlouvám platíte asi polovinu, co běžní hosté v hotelech stejné kategorie a je to znát: prostě tam nepatříte. Profesionální personál to na sobě nedá znát, ale prozradíte se pokaždé sami. Sami si odnesete kufry, na snídani si toasty dáte do opékače bez asistence, v hotelovém baru neutratíte stovku euro za jeden večer a vodu z minibaru za deset éček si nedáte, ani kdyby vás nutili.

Druhým důvodem je zbytečnost: místo concierge použijete tripadvisor, postel by vám stačila poloviční a velikost televize je irelevantní. Stačil by jeden ručník namísto tří, kosmetickou taštičku si vozíte vlastní a placené filmy v hotelové televizi frčely možná před dvaceti lety.

Třetím a hlavním důvodem je jednoduše čas: Hotel je pro vás místo na sprchu a spánek. Na objednání masáží nebo snídaně do postele jednoduše nemáte čas. Nemáte, protože priority mimo domov jsou zcela jiné.

 

Ostatní poutníci

Samostatnou kategorií jsou pánové v duty-free shopech při návratu z cílové destinace. Strhané a zamyšlené tváře bloumající mezi regály, které se snaží vzpomenout, jaké chutě jejich okolí vlastně preferuje. Kokos, nugát, nebo raději láhev koňaku?

Co služebka a dny mimo domov, to odměny pro chápající okolí. Bonboniéry, lahvinky, vůně nebo tablet. Přítelkyně, ženy, děti nebo širší rodina – nikdo nesmí přijít zkrátka, kapitál se musí točit. Alespoň tak to přeci diktuje vlna průchozích obchodů na letišti, které rozvržením připomínají něco mezi Člověče nezlob se a obchodem IKEA.

 

Návraty

Pátek, lehce před půlnocí a otevíráte dveře u domu. Rychlá sprcha, postel a konečně pořádný spánek. Druhý den vybalit, vyprat, vyžehlit … a příští týden zase znovu!

Encoding error when importing DataStage project

Common error when importing project from machine to another may be with encoding:

You can solve it very easily – just open the file you want to import and change CharacterSet attribute to desired encoding:

Simple, huh?

Continue reading

DataStage Oracle connector error: The variable bInvalidDateTime has value 1

If you encounter an error The variable bInvalidDateTime has value 1 while running your job containing output Oracle stage, it is most likely caused by non-date value inserted to date column in target database.

In case you want to ignore this error and insert a NULL instead of non-valid date (or timestamp), there is a simple solution: add new environment variable CC_ORA_INVALID_DATETIME_ACTION and set it to NULL value (it is essential to not mistake project and environment variables):

  • Open Job properties (or use shortcut Ctrl + J)
  • Select Parameters tab
  • Click Add new Environment variable
  • Add new variable called CC_ORA_INVALID_DATETIME_ACTION, enter any prompt value
  • Add newly created variable to your project
  • On Parameters tab input NULL as Default value for newly added $CC_ORA_INVALID_DATETIME_ACTION

And done! Now all your non-valid dates should be replaced by NULLs in target database. Continue reading

Uncompressing files into HDFS (Wikipedia dump example)

In case you want to test your Big Data environment, there is one very simple way, how to do it: Download Wikipedia dump and analyze it with Word Count application. We will focus on the first step – downloading the data and loading it into HDFS. This can be achieved by several ways. Today I’ll show you one of the simplest, yet efficient way. So let’s get started!

Step one: download latest English Wikipedia dump to some temporary folder (10,5 GB of compressed data, more than 45 GB after unziping):

Step two: copy it directly into your HDFS without unpacking it to local filesystem:

Step three: there is none, because you are DONE! Simple, huh? :)

Continue reading

How to cleanup old Datasets in DataStage automatically

This is a procedure useful not only for DataStage environment. Often you need to delete old logs periodically in order to save disk space. But especially in DataStage, which lacks automatic datasets cleanup is handy to delete old datasets. These may originate from your DataStage Dataset stages, or as a temporary resource from Lookup stage and others.

On our production system there was over 20 GB of old Datasets. But be careful, in case you are using Datasets for some long-term saving of data, don’t use the following commands. Progress on your own discretion!

Solution is simple – build a batch file, which executes a command over all files in specified directory, where file modification date is more than X days ago.

Geniue syntax:

In case you want to test it and move data to temporary directory first, just change the executed command:

An example with deletion (be careful, there is no warning after issuing this command):

With an actual data:

Save these commands as a BAT file, run Task Scheduler and make a new task running this file on regular basis. Make sure the task is working without a problem and that’s it, problem solved.

Source: http://www.windows-commandline.com/find-files-based-on-modified-time/