本站首页    管理页面    写新日志    退出


«October 2025»
1234
567891011
12131415161718
19202122232425
262728293031


公告

数据仓库&数据挖掘

  对某一件事需要坚持方能真正完成这件事

            薛 峰  

           2009.02.03


我的分类(专题)

日志更新

最新评论

留言板

链接

Blog信息
blog名称:数据仓库与数据挖掘
日志总数:85
评论数量:14
留言数量:0
访问次数:724372
建立时间:2005年3月17日




[数据仓库]数据仓库设计的21条原则 
网上资源,  软件技术,  电脑与网络

薛 峰 发表于 2005/3/28 23:05:38

7个步骤,7个禁忌和7种思路
高效实现数据仓库的七个步骤

数据仓库和我们常见的RDBMS系统有些亲缘关系,但它又有所不同。如果你没有实施过数据仓库,那么从设定目标到给出设计,从创建数据结构到编写数据分析程序,再到面对挑剔的用户的评估,整个过程都会带给你一种与以往的项目完全不同的体验。一句话,如果你试图以旧有的方式创建数据仓库,那你所面对的不是预算超支就是所建立的数据仓库无法良好运作。

在处理一个数据仓库项目时需要注意的问题很多,但同时也有很多有建设性的参考可以帮助你更顺利的完成任务。开放思维,不断尝试新的途径,对于找到一种可行的数据仓库实现方法来说也是必需的。

1. 配备一个全职的项目经理或你自己全面负责项目管理
在通常情况下,项目经理都会同时负责多个项目的实施。这么做完全是出于资金和IT资源方面的考虑。但是对于数据仓库项目的管理,绝对不能出现一人身兼数个项目的情况。由于你所处的领域是你和你的团队之前没有进入过


阅读全文(4296) | 回复(0) | 编辑 | 精华 | 删除
 


[综合]windows2003找出移动硬盘
网上资源,  电脑与网络

薛 峰 发表于 2005/3/26 12:27:45


笔者一向喜欢尝试新软件。这不,Windows Server 2003刚出来,笔者就迫不及待地装上了。可是当笔者接上IBM的移动硬盘后,虽然任务栏右下方出现了移动硬盘的图标,信息显示也是正常,但是在“我的电脑”中就是显示不出驱动器的盘符。借了块朋友的“纽曼”移动硬盘也同样不认。试着重新安装移动硬盘的驱动程序(原本是无须安装的),系统提示驱动已经安装。奇怪的是电脑却能毫不费力认出笔者那块闪存。
  笔者后来读了一篇有关组策略的文章,这篇文章讲到用“组策略”隐藏驱动器的方法,笔者想,既然用“组策略”能隐藏驱动器的盘符,那么能不能将没有显示出来的驱动器盘符显示出来呢?带着这个问题,笔者打开了组策略,操作步骤是:点击“开始→运行”中输入“MMC”回车,进入了“控制台1”,然后点“文件→添加删除管理单元→添加”,出现了“添加独立管理单元”的界面,在其中细细查找,发现了“磁盘管理”一项,再点“添加→完成→关闭→确定”,这时候回到“控制台1”,点击“磁盘管理”,这时看到右边栏中显示出了所有的硬盘驱动器,包括移动硬盘,但却没有显示出移动硬盘的盘符来。


阅读全文(4080) | 回复(0) | 编辑 | 精华 | 删除
 


[数据仓库]ruanstats 数据库优化
文章收藏,  电脑与网络,  科学研究

薛 峰 发表于 2005/3/25 16:35:53

  系统运行一段时间以后,用户抱怨某些操作响应速度过慢;这个在项目前期没有出现过类似问题,因此怀疑是数据量过大造成的原因。但是,查询相关业务表中仅仅只有3万多的的数据量,不足以构成影响程序响应速度过慢的瓶颈。更奇怪的是采用导入的方法将此表数据装载进来却没有发现上述现象,我百思不得其解。 几天后,无意间翻阅一本杂志,其中有这么一段话——“每当SQL语句被发送到到DB2 数据库管理器中处理时,SQL 优化器会去读取系统编目表来确定被引用的列的特性以及在被引用的表中时候已经定义了索引,同时被语句引用的每个表的大小也包括在内。根据这些得到的信息,优化器可以估算出能满足SQL语句需要的每一种数据存取路径的成本,然后推荐最佳的一个。 优化器用于做决策的数据库统计集合数据在系统编目表中是一个关键性的元素。所以,统计的变化可能导致选择存取路径的变化;如果信息丢失或过时,优化器也许选择出来的存取计划将导致SQL语句执行时间比正常的要长。例如,一个删除操作可能留下以后不能再使用的空的数据页面。对各种长度的字段进行更新可能导致新的字段值不适合在同一个数据页面中存放。这

阅读全文(1650) | 回复(0) | 编辑 | 精华 | 删除
 


[综合]ID3算法源程序(C语言)
网上资源,  软件技术,  电脑与网络,  科学研究

薛 峰 发表于 2005/3/25 15:43:53

PROTO.H
NEGENTROPY negentropy ( REAL **, UINT, NODE*, UINT );
void print_tree ( NODE* , CHAR** );
void free_tree ( NODE  * );
NODE* ID3 ( MATRIX * , NODE* , UINT , UINT );
void err_exit ( CHAR* , UINT );
MATRIX *build_matrix ( UINT, UINT );
void free_matrix ( MATRIX * );
void read_matrix ( CHAR *, MATRIX * );
void file_size ( CHAR * , UINT * , UINT * );
CHAR **read_tags ( CHAR * , UINT );
void free_tags ( CHAR **, UINT);

ID

阅读全文(20950) | 回复(4) | 编辑 | 精华 | 删除
 


[综合]SAS认证与数据挖掘、商业智能职业发展
网上资源,  软件技术,  电脑与网络

薛 峰 发表于 2005/3/25 14:47:34

.............................................................................................
  何为数据挖掘和商业智能?

  与数据挖掘相关的词汇有例如数据仓库,数据装载(ETL),数据挖掘(Data Mining), 客户关系管理(CRM),SAS,PeopleSoft, SAP等。到上个世纪九十年代,以数据存储为目的的联机分析处理系统(OLTP)已经发展得相当成熟,关系型数据库的应用已经非常普及,大型企业或部门积累了大量原始数据。这些数据是按照关系型结构存储,在更新,删除,有效存储(少冗余数据)方面表现出色,但在复杂查询方面效率却十分低下。为充分利用已有数据,提供复杂查询,提供更好的决策支持,出现了数据仓库(Data Warehouse)。数据仓库与数据库(这里的数据库指关系型数据库)的区别在于,数据仓库以方便查询(称为主题)为目的,打破关系型数据库理论中标准泛式的约束,将数据库的数据重新组织和整理,为查询,报表,联机分析等

阅读全文(2003) | 回复(0) | 编辑 | 精华 | 删除
 


« 11 12 13 14 15 16 17 »



站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.055 second(s), page refreshed 144798864 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号