<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Lanziani Blog &#187; Framework</title>
	<atom:link href="http://lanziani.com/blog/category/framework/feed/" rel="self" type="application/rss+xml" />
	<link>http://lanziani.com/blog</link>
	<description>my personal blog</description>
	<lastBuildDate>Tue, 17 Aug 2010 09:36:57 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
<atom:link rel="hub" href="http://pubsubhubbub.appspot.com" />
	<atom:link rel="hub" href="http://superfeedr.com/hubbub" />
			<item>
		<title>How to configure Pseudo-distributed hadoop</title>
		<link>http://lanziani.com/blog/2009/11/26/how-to-configure-pseudo-distributed-hadoop/</link>
		<comments>http://lanziani.com/blog/2009/11/26/how-to-configure-pseudo-distributed-hadoop/#comments</comments>
		<pubDate>Thu, 26 Nov 2009 15:06:33 +0000</pubDate>
		<dc:creator>Nss</dc:creator>
				<category><![CDATA[Framework]]></category>
		<category><![CDATA[Linux]]></category>
		<category><![CDATA[Misc]]></category>
		<category><![CDATA[apache]]></category>
		<category><![CDATA[configurare]]></category>
		<category><![CDATA[debian]]></category>
		<category><![CDATA[hadoop]]></category>
		<category><![CDATA[pseudo-distribuito]]></category>
		<category><![CDATA[ubuntu]]></category>

		<guid isPermaLink="false">http://lanziani.com/blog/?p=164</guid>
		<description><![CDATA[Come prerequisito di questa guida vi è quello di aver già installato hadoop, cosa che potete fare seguendo al guida How to install hadoop standalone che potete trovare sempre su questo blog. Entriamo nel sistema con l&#8217;utente hadoop creato nella guida precedente&#8230; l&#8217;avete seguita attentamente VERO!!! Per prima cosa è necessario scaricare il pacchetto con [...]]]></description>
			<content:encoded><![CDATA[<p>Come prerequisito di questa guida vi è quello di aver già installato hadoop, cosa che potete fare seguendo al guida <strong>How to install hadoop standalone</strong> che potete trovare sempre su questo blog.</p>
<p>Entriamo nel sistema con l&#8217;utente hadoop creato nella guida precedente&#8230; <strong>l&#8217;avete seguita attentamente VERO!!!</strong></p>
<p><span id="more-164"></span><br />
Per prima cosa è necessario scaricare il pacchetto con i file di configurazione:</p>
<pre>sudo apt-get install hadoop-0.20-conf-pseudo</pre>
<p>dopo di che è necessario configurare le chiavi ssh per far si che non venga chiesta la password ad ogni connessione, per fare ciò bisognerà posizionarsi all&#8217;interno della home di hadoop:</p>
<pre>cd ~</pre>
<p>e lanciare i seguenti comandi:</p>
<pre>
ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
</pre>
<p>Finito, per verificarne il funzionamento, lanciare il comando:</p>
<pre>/usr/lib/hadoop/bin/start_all.sh</pre>
<p>e verificare la presenza delle seguenti pagine web:</p>
<p><a href="http://localhost:50030/">http://localhost:50030/</a><br />
<a href="http://localhost:50070/">http://localhost:50070/</a></p>
<p>stoppare quindi il servizio con il comando:</p>
<pre>/usr/lib/hadoop/bin/stop_all.sh</pre>
<div class="shr-publisher-164"></div>]]></content:encoded>
			<wfw:commentRss>http://lanziani.com/blog/2009/11/26/how-to-configure-pseudo-distributed-hadoop/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>How to install hadoop standalone</title>
		<link>http://lanziani.com/blog/2009/11/10/how-to-install-hadoopcloudera/</link>
		<comments>http://lanziani.com/blog/2009/11/10/how-to-install-hadoopcloudera/#comments</comments>
		<pubDate>Tue, 10 Nov 2009 16:26:30 +0000</pubDate>
		<dc:creator>Nss</dc:creator>
				<category><![CDATA[Framework]]></category>
		<category><![CDATA[Misc]]></category>
		<category><![CDATA[Programming]]></category>
		<category><![CDATA[apache]]></category>
		<category><![CDATA[computazione distribuita]]></category>
		<category><![CDATA[configurare]]></category>
		<category><![CDATA[configurazione]]></category>
		<category><![CDATA[hadoop]]></category>
		<category><![CDATA[installazione]]></category>

		<guid isPermaLink="false">http://lanziani.com/blog/?p=31</guid>
		<description><![CDATA[Per necessita è stato necessario installare sul nostro calcolatore hadoop. The Apache Hadoop project develops open-source software for reliable, scalable, distributed computing http://hadoop.apache.org/. Vediamo i passi per installare l&#8217;ambiente su una distribuzione debian/ubuntu. Il primo passo sarà quello di aggiungere i repository necessari all&#8217;installazione, editiamo quindi con il nostro editor preferito il file /etc/apt/sources.list.d/cloudera.list (se [...]]]></description>
			<content:encoded><![CDATA[<p>Per necessita è stato necessario installare sul nostro calcolatore hadoop.<br />
The Apache Hadoop project develops open-source software for reliable, scalable, distributed computing<br />
<a href="http://hadoop.apache.org/">http://hadoop.apache.org/</a>.</p>
<p><span id="more-31"></span><br />
Vediamo i passi per installare l&#8217;ambiente su una distribuzione debian/ubuntu.<br />
Il primo passo sarà quello di aggiungere i repository necessari all&#8217;installazione, <strong>editiamo</strong> quindi con il nostro editor preferito <strong>il file /etc/apt/sources.list.d/cloudera.list</strong> (se non esiste creiamolo) e aggiungiamo le seguenti righe.</p>
<pre>deb http://archive.cloudera.com/debian DISTRO-testing contrib
deb-src http://archive.cloudera.com/debian DISTRO-testing contrib</pre>
<p><strong>sostituendo a DISTRO o <em>hardy</em> o <em>intrepid</em> o <em>jaunty</em></strong></p>
<p>aggiungiamo repository key.</p>
<pre>curl -s http://archive.cloudera.com/debian/archive.key | \
sudo apt-key add -</pre>
<p>a questo punto basterà lanciare il comando</p>
<pre>sudo apt-get update</pre>
<p>per aggiornare il database dei pacchetti,</p>
<p>aggiungiamo quindi l&#8217;utente hadoop con il seguente comando:</p>
<pre>sudo useradd --home /home/hadoop \
        --groups adm,dialout,plugdev,lpadmin,admin,sambashare \
        --shell /bin/bash \
        --create-home hadoop</pre>
<p>e settiamo la password dell&#8217;utente appena creato con il comando:</p>
<pre>sudo passwd hadoop</pre>
<p>il resto va effettuato utilizzando l&#8217;utente hadoop, cambiamo quindi utente e continuiamo con il resto della guida.</p>
<p>Installiamo da prima ssh con il comando:</p>
<pre>sudo apt-get install ssh</pre>
<p>e rsync con il comando.</p>
<pre>sudo apt-get install rsync</pre>
<p>Per installare hadoop lanciamo il comando:</p>
<pre>sudo apt-get install hadoop-0.20</pre>
<p>Il software sarà quindi installato nella directory <strong>/usr/lib/hadoop-0.20</strong>, è necessario da subito settare la variabile <strong>JAVA_HOME</strong> all&#8217;interno del file <strong>/usr/lib/hadoop-0.20/conf/hadoop-env.sh</strong>.<br />
Se avete installata la versione 6 della jdk della sun vi basterà cercare la riga:</p>
<pre># export JAVA_HOME=/usr/lib/j2sdk1.5-sun</pre>
<p>e sostituirla con la seguente:</p>
<pre>export JAVA_HOME=/usr/lib/jvm/java-6-sun</pre>
<p>l&#8217;installazione a questo punto è terminata e potrete verificarne la correttezza con il seguente test, spostatevi da prima nella directory di hadoop:</p>
<pre>cd /usr/lib/hadoop-0.20</pre>
<p>e da utente hadoop lanciate i seguenti comandi:</p>
<pre>
mkdir input
cp conf/*.xml input
bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'
cat output/*
</pre>
<p>L&#8217;esempio di cui sopra copia il contenuto della directory conf all&#8217;interno della directory input e su questi file cerca e visualizza il contenuto dell&#8217;espressione regolare passata.<br />
L&#8217;output viene quindi salvato all&#8217;interno della directory output.</p>
<p>La guida è stata tratta e tradotta da:<br />
<a href="http://hadoop.apache.org/common/docs/current/quickstart.html">http://hadoop.apache.org/common/docs/current/quickstart.html</a></p>
<div class="shr-publisher-31"></div>]]></content:encoded>
			<wfw:commentRss>http://lanziani.com/blog/2009/11/10/how-to-install-hadoopcloudera/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
