西西软件园多重安全检测下载网站、值得信赖的软件下载站!
软件
软件
文章
搜索

首页西西教程数据库教程 → SQL Server 2008 数据挖掘新功能实现

SQL Server 2008 数据挖掘新功能实现

相关软件相关文章发表评论 来源:MSDN时间:2010/9/30 17:05:22字体大小:A-A+

作者:佚名点击:534次评论:0次标签: SQLServer2008 数据挖掘

  • 类型:数据库类大小:10.5M语言:中文 评分:1.4
  • 标签:
立即下载
Microsoft SQL Server Analysis Services 的这个最新版本引入了新功能和增强功能。

创建维持测试集

现在创建挖掘结构时,可以将挖掘结构中的数据划分为定型集和测试集。分区的定义与结构存储在一起,以便可以在基于该结构的任何挖掘模型中重用定型集和测试集。


数据在定型分区和测试分区之间随机划分,但是如果需要重新创建分区,也可以指定用于创建分区的种子。


可以按照总行数的百分比或最大行数,或者结合这两项要求来指定测试集的大小。有关如何使用定型数据集和测试数据集的详细信息,请参阅将数据分区为定型集和测试集(Analysis Services - 数据挖掘)。


有关 SQL Server 2008 中的所有模型验证功能的详细信息,请参阅验证数据挖掘模型(Analysis Services – 数据挖掘)。


筛选模型事例

现在,可以将筛选器附加到挖掘模型,并在定型和测试期间应用筛选器。对模型应用筛选器,可以控制用于给模型定型的数据,也更容易评估出模型对数据子集的准确情况。


例如,您可能想要知道目标邮件模型对于某种收入水平的客户的准确性。您可以在创建提升图时对挖掘模型的 Income 列应用筛选器,并仅查看该人口统计的结果。


Business Intelligence Development Studio 还提供了新的筛选器编辑器,可帮助您生成适用于事例表和嵌套表的复杂条件。


有关如何创建挖掘模型筛选器的详细信息,请参阅为挖掘模型创建筛选器(Analysis Services – 数据挖掘)。


有关为挖掘模型测试筛选数据的信息,请参阅模型准确性图表工具(Analysis Services - 数据挖掘)。


多个挖掘模型的交叉验证

交叉验证是用于评估数据挖掘模型的准确性的既定方法。在交叉验证中,可反复将挖掘结构数据分为多个子集,生成子集的模型,然后衡量每个分区的模型的准确性。通过查看返回的统计信息,可以确定挖掘模型的可靠程度,并且可以更容易地对比基于相同结构的模型。


数据挖掘设计器的“挖掘准确性图表”视图中可以使用交叉验证。您也可以使用 Analysis Services 存储过程对挖掘结构分区,测试多个挖掘模型,以及生成分析。


若要在 SQL Server 2008 中生成交叉验证报表,请指定挖掘结构和可预测属性,然后指定用于分割事例数据的折叠数。


Analysis Services 将返回一个表,报告各个分区的可能性或均方根误差,以及聚合模型的所有度量值的平均偏差和标准偏差等统计信息。有关详细信息,请参阅交叉验证(Analysis Services – 数据挖掘)。


支持 Office 2007 数据挖掘外接程序

使用 SQL Server 2008 Office 2007 数据挖掘外接程序时,SQL Server 2008 支持从 Microsoft Excel 创建、管理和使用数据挖掘模型。通过增加对服务器端定型和测试分区、交叉验证和几个新的分析工具(例如购物篮分析和可打印预测计算器)的支持,此最新版本的受欢迎的免费外接程序已得到增强。


还可以使用文档模型向导轻松为存储在 SQL Server 2008 实例中的结构和模型创建文档。有关外接程序的详细信息,请参阅 Data Mining Add-ins for Office 2007(Office 2007 数据挖掘外接程序)。


Microsoft 时序算法的增强功能

为了改进时序模型中某些预测的准确性和稳定性,在 Microsoft 时序算法中增加了一种新的算法。该新算法基于熟知的 ARIMA 算法,它比 Analysis Services 一直使用的 ARTxp 算法可提供更佳的长期预测。(ARTxp 是自动回归树算法,针对单个时间段预测或短期预测进行了优化。)


默认情况下,Microsoft 时序算法的新实现使用 ARTxp 算法来定型一种版本的模型,使用 ARIMA 算法来定型另一种版本。然后,该算法将权衡这两种模型的结果,以便提供您希望的预测特征。如果不想使用此默认实现,可以指定 Microsoft 时序算法仅使用 ARTxp 或 ARIMA 算法。在 SQL Server 2008 Enterprise 中,可以指定算法的自定义加权,以便提供对可变时间范围的最佳预测。


现在,Microsoft 时序算法还可在预测期间接受数据以启用新的业务方案。例如,可以创建基于平均叉积、区域聚合或其他某种大数据集的收入预测模型。然后,将该模型应用于显示各种产品销售额的时序。通过应用常规模型,可以利用聚合数据的稳定性和可用性,并自定义对各种产品的预测。


也可以使用多个时序定型数据,然后对新数据应用该模型以预测“假设”情况。


有关时序挖掘模型的详细信息,请参阅 Microsoft 时序算法(Analysis Services – 数据挖掘)和 PredictTimeSeries (DMX)。


钻取到结构事例和结构列

在 SQL Server 2008 中,如果对挖掘结构启用钻取,则可以查询挖掘结构并返回有关用于定型和测试的事例的详细信息。可以使用数据挖掘扩展插件 (DMX) 创建对结构的钻取查询。


而且,如果对挖掘模型和相关的挖掘结构启用钻取,则可以创建用于在基础挖掘结构中检索数据列的查询。如果想要发现有关特定节点中的事例的详细信息,此功能很有用。例如,可以在特定群集中检索客户的联系信息。


有关详细信息,请参阅针对挖掘模型和挖掘结构使用钻取(Analysis Services – 数据挖掘)。


有关挖掘结构的 DMX 查询的示例,请参阅 SELECT FROM <结构>.CASES。


有关从模型到结构数据的钻取的示例,请参阅 SELECT FROM <模型>.CASES (DMX)。


对挖掘模型列使用别名

现在,可以为挖掘模型中的列添加别名,以便于理解列内容和在 DMX 语句中引用列。


例如,如果生成的挖掘结构包含同一数据的连续版本和离散化版本,则可以为这两列指定相同的名称,以便于比较。


有关如何管理和查看别名的详细信息,请参阅设置挖掘模型的属性或如何为模型列创建别名。


有关如何使用 DMX 创建列别名的信息,请参阅 ALTER MINING STRUCTURE (DMX)。


查询数据挖掘架构行集

在 SQL Server 2008 中,许多现有 OLE DB 数据挖掘架构行集已作为可以使用 DMX 语句轻松查询的一组系统表公开。从而更加易于检索与模型和结构相关的元数据、从挖掘模型内容提取详细信息,或者监视 Analysis Services 实例或服务。


有关详细信息,请参阅查询数据挖掘架构行集(Analysis Services - 数据挖掘)。


新示例位置

联机丛书不再提供 SQL Server 示例数据库和示例应用程序。这些示例数据库和示例应用程序现在位于 SQL Server Samples(SQL Server 示例)网站上。该网站便于用户查找这些示例,还提供了与 Microsoft SQL Server 和商业智能相关的其他新示例。在 SQL Server 示例网站上,您可以执行下列操作:


-浏览由开发人员、用户和 Microsoft 最有价值专家 (MVP) 社区提供的示例。


-下载示例数据库和代码项目。


-查看或参与讨论区,您可以在讨论区报告和询问与各技术领域的示例相关的问题。


与 SQL Server 2005 Analysis Services 并行安装

SQL Server 2008 Analysis Services 现在可与 SQL Server 2005 Analysis Services (SSAS) 并行安装。有关详细信息,请参阅使用 SQL Server 的多个版本和实例。


对于影响 Analysis Services 的重要的并行安装问题,请参阅本版本所附的自述文件。


备份和还原 Analysis Services 数据库

备份和还原 Analysis Services 数据库的功能已得到增强。减少了对数据库大小的限制,备份和还原操作需要的时间已大大降低。


有关详细信息,请参阅新增功能(Analysis Services - 多维数据库)。


Analysis Services 的其他增强功能

如果使用 Analysis Services 来创建也用于数据挖掘的 OLAP 多维数据集,您可能会发现可以更容易地设计维度及其相关的层次结构和属性。维度设计器中提供了新的属性关系设计器,可帮助您设计属性关系,并确保属性关系遵循最佳实践。
    sql server
    (11)sql server
    西西软件园提供免费的下载,是很多小型企业公司使用到的数据库软件,是一个功能强大且可靠的数据管理系统,它功能丰富,能保护数据,并且可改善嵌入式应用程序客户端轻型应用程序以及本地数据存储区的性能。具有易于部署以及可以快速设计原型的特点,您可以无偿获取并可以随应用程序免费再分发。它设计成可与其他服务器基础结构资产无缝集成。...更多>>

    相关评论

    阅读本文后您有什么感想? 已有人给出评价!

    • 8 喜欢喜欢
    • 3 顶
    • 1 难过难过
    • 5 囧
    • 3 围观围观
    • 2 无聊无聊

    热门评论

    最新评论

    发表评论 查看所有评论(0)

    昵称:
    表情: 高兴 可 汗 我不要 害羞 好 下下下 送花 屎 亲亲
    字数: 0/500 (您的评论需要经过审核才能显示)