现在位置: 首页 > siesta发表的所有文章
  • 06月
  • 05日
综合 ⁄ 共 2227字 评论关闭
一:背景 很多数据源中的数据都是含有大量重复的,为此我们需要将重复的数据去掉,这也称为数据的清洗,MapReduce从Map端到Reduce端的Shuffle过程天生就有去重的功能,但是这是对输出的Key作为参照进行去重的。所以我们可以将Map端读入Value作为Key输出,就可以很方便的实现去重了。 二:技术实现 #需求 有两个文件file0和file1。将两个文件中的内容合并去重。 #file0的内容如下: 1 1 2 2 3 3 4 4 5 5 6 6 7 8 9 file1的内容如下: 1 9 9 8 8 7 7 6 6 5 5 4 4 2 1 2 代码实现: public class DistinctTest { // 定义输入路......
阅读全文
  • 05月
  • 24日
综合 ⁄ 共 6068字 评论关闭
缓存是介于应用程序和物理数据源之间,其作用是为了降低应用程序对物理数据源访问的频次,从而提高了应用的运行性能。缓存内的数据是对物理数据源中的数据的复制,应用程序在运行时从缓存读写数据,在特定的时刻或事件会同步缓存和物理数据源的数据。 基本信息   缓存的介质一般是内存,所以读写速度很快。但如果缓存中存放的数据量非常大时,也会用硬盘作为缓存介质。缓存的实现不仅仅要考虑存储的介质,还要考虑到管理缓存的并发访问和缓存数据的生命周期。   Hibernate的缓存包括Session的缓存和SessionFactory的缓存,其......
阅读全文
  • 05月
  • 21日
综合 ⁄ 共 658字 评论关闭
最近在编程的时候,发现分别用get和post发送中文数据,后者可以得到正确结果,   前者却是乱码。查了些资料,发现服务器对post和get请求的数据的编码处理是不一样的   。现把tomcat下get和url直接发送请求乱码的解决办法列举如下: 方法1.  String name = new String((request.getParameter("name")).getBytes("ISO-8859-   1"),"GBK")  方法2. 1) 打开tomcat的server.xml文件,找到区块,加入如下一行: URIEncoding=”GBK” 完整的应如下: <Connector  port="80" maxThreads="150" minSpareThreads="25" maxSpareThreads="75" ......
阅读全文
  • 05月
  • 03日
综合 ⁄ 共 287字 评论关闭
 1.什么是函数? 函数就是定义在类中的具有特定功能的一段独立小程序。  2.格式:   修饰符 返回值类型 函数名(参数类型 形式参数1,参数类型 形式参数2,....)   {    执行语句;    return 返回值;   }   返回值类型:函数运行后的数据类型。   参数类型:指形式参数的数据类型   形式参数:是一个变量,用于储存当函数被调用是传进来的实际参数   return:返回该函数运算的结果,return语句;后的语句将执行不到,如无须返回数据,即void时,则可以省略return语句。     转载请注明出处,谢谢!作者:逝秋http://blog.csdn.n......
阅读全文
  • 04月
  • 24日
综合 ⁄ 共 837字 评论关闭
Description     约翰的干草库存已经告罄,他打算为奶牛们采购日(1≤日≤50000)磅干草.     他知道N(1≤N≤100)个干草公司,现在用1到N给它们编号.第i个公司卖的干草包重量为Pi(1≤Pi≤5000)磅,需要的开销为Ci(l≤Ci≤5000)美元.每个干草公司的货源都十分充足,可以卖出无限多的干草包.    帮助约翰找到最小的开销来满足需要,即采购到至少H磅干草. Input     第1行输入N和日,之后N行每行输入一个Pi和Ci. Output       最小的开销. Sample Input 2 15 3 2 5 3 Sample Output 9 FJ can buy three packages from the second......
阅读全文
  • 04月
  • 07日
综合 ⁄ 共 503字 评论关闭
前言:以前,刚学C语言时候递归总是令我头疼!看汉诺塔的算法时,就用手指掐着算,如此也老是记得前边忘了后面。这个程序是一个群友问的,想了好一会才想出来。 源代码: //使用递归计算数组中各元素的乘积class ArrayMul...{    public int mul(int arr[],int n)...{ //递归实现方法        if(n<=1)...{            return arr[0];        }        else...{            return mul(arr,n-1)*arr[n-1];        }    }    public static void main(String[] args)...{ //主函数        int[] arr=...{3,1,2,5};        Array......
阅读全文
  • 01月
  • 17日
综合 ⁄ 共 834字 评论关闭
一道比最基础的并查集有优化的题; l         并查集的优化 1、Find_Set(x)时 路径压缩寻找祖先时我们一般采用递归查找,但是当元素很多亦或是整棵树变为一条链时,每次Find_Set(x)都是O(n)的复杂度,有没有办法减小这个复杂度呢?答案是肯定的,这就是路径压缩,即当我们经过"递推"找到祖先节点后,"回溯"的时候顺便将它的子孙节点都直接指向祖先,这样以后再次Find_Set(x)时复杂度就变成O(1)了,如下图所示;可见,路径压缩方便了以后的查找。 2、Union(x,y)时 按秩合并即合并的时候将元素少的集合合并到元素多的集合中,这......
阅读全文
  • 12月
  • 14日
综合 ⁄ 共 4965字 评论关闭
在之前一篇博文中, 有同学在评论中问了个问题: 如何解决因式分解带来的推荐冷门,热门关键词的问题。 在回答这个问题的时候, 想到了近几年在做搜索推荐系统的过程中, 学术界和工业界的一些区别。 正好最近正在做技术规划, 于是写偏文章说下工业界完整推荐系统的设计。结论是: 没有某种算法能够完全解决问题, 多重算法+交互设计, 才能解决特定场景的需求。下文也对之前的一些博文进行梳理,构成一个完整工业界推荐系统所具有的方方面面(主要以百度关键词搜索推荐系统为例) 完整的推荐系统肯定不会只用一种推荐算法 在......
阅读全文
  • 12月
  • 02日
综合 ⁄ 共 1406字 评论关闭
废话不多说,直接给代码: /** * */ package com.adam.dev.utils; import java.io.IOException; import javax.servlet.Filter; import javax.servlet.FilterChain; import javax.servlet.FilterConfig; import javax.servlet.ServletException; import javax.servlet.ServletRequest; import javax.servlet.ServletResponse; import javax.servlet.http.HttpServletRequest; import javax.servlet.http.HttpServletResponse; /** * @author adam.胡升阳 * 创建日期 2011-5-4 */ public class EncoderFilter implements F......
阅读全文
  • 10月
  • 23日
综合 ⁄ 共 2006字 评论关闭
一、启动android默认浏览器   Intent intent = new Intent();           intent.setAction("android.intent.action.VIEW");       Uri content_url = Uri.parse("http://www.cnblogs.com");      intent.setData(content_url);     startActivity(intent);   这样子,android就可以调用起手机默认的浏览器访问。   二、指定相应的浏览器访问   1、指定android自带的浏览器访问   (“com.android.browser”:packagename;“com.android.browser.BrowserActivity”:启动主activity)   Intent intent = new Intent(......
阅读全文
  • 10月
  • 15日
综合 ⁄ 共 1398字 评论关闭
大白鼠上的简单BFS。。。 今天简直累爱,本想做一道简单题放松心情的,结果调了我一早上= =,最后才发现是路径和记录的对不上导致错误,真是坑QAQ,不爱了不爱了。。。 就是每个节点记录三个信息,坐标,朝向,颜色。然后扩展节点的时候,要么前进,要么转向,然后最后第一次到达终点时的花费一定是最小的,BFS嘛。 代码如下: #include <stdio.h> #include <string.h> #include <algorithm> using namespace std ; #define REP( i , n ) for ( int i = 0 ; i < n ; ++ i ) #define clear( A , X ) mems......
阅读全文
  • 05月
  • 26日
综合 ⁄ 共 1349字 评论关闭
对于C++ STL,大部分人的观点都先会用,然后知其道理(怎么工作),最后是修改内部灵活运用。。 即下面的流程: 怎么用====》什么原理====》灵活应用。。 想到自己连用都不能,特别学习一下,达到在怎么用水平上的炉火纯青,然后在去弄明白其中的道理,最后再是灵活应用。。 vector - How  to use.. Code: #include <iostream> #include <algorithm> #include <vector> using namespace std; int main() { vector<int> ve; vector<int>::iterator vit; // push_back().. 压到vector......
阅读全文