如何在Win10系统使用Python3连接Hive

脚本专栏 2024/9/28 佚名

3 1 2

由于数据存放在大数据平台的Hive数据仓库中，我需要在Win10系统上利用Python3连接Hive，然后读取数据，进行探索、分析和挖掘工作。

我通过网上查找资料和实际测试，把Win10系统Python3成功连接Hive配置总结如下。

第一步：安装依赖库

pip install bitarray
pip install bit_array
pip install thrift
pip install thriftpy
pip install pure_sasl
pip install --no-deps thrift-sasl==0.2.1

提示：若是无法安装，也可以点击如下网址，

https://www.lfd.uci.edu/~gohlke/pythonlibs/

选择合适库的whl下载，然后进行本地化安装。

第二步：安装impyla库

我采用本地化安装方式，先下载impyla库的whl，如下图：

再安装

pip install E:/Python_Library/impyla-0.16.2-py2.py3-none-any.whl

提示：上面的绝对路径根据你自己的情况而定

第三步：测试impyla库是否可以使用

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

若是运行通过，表示利用impala连接Hive配置成功。

简单示例：

从Hive的一张表读取100条记录，放到pandas的DataFrame里面。

参考代码：

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

conn = connect(host='my.host.com', port=21050)
cursor = conn.cursor()
cursor.execute('SELECT * FROM mytable LIMIT 100')
df = as_pandas(cursor)
cursor.close()

参考资料

https://github.com/cloudera/impyla

以上就是如何在Win10系统使用Python3连接Hive的详细内容，更多关于Python3连接Hive的资料请关注其它相关文章！

Python,连接Hive,win10,连接Hive

风云阁资源网 Design By www.bgabc.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

风云阁资源网 Design By www.bgabc.com

评论“如何在Win10系统使用Python3连接Hive”

暂无评论...

www.bgabc.com 风云阁资源网

120,135影音资源

344,641技术资源

22,817软件资源

435,032站长资源

最新文章

李国祥.1995-九五变奏【嘉音】【WAV+CUE】

2024/9/28

许景淳.1992-你来自何方【全美唱片】【WAV+

2024/9/28

石欣卉.2007-剧欣卉集·完整电视剧主题精丫华

2024/9/28

群星.2005-LOVE情歌集VOL.5.2CD【正东】【W

2024/9/28

孙悦.1996-伙伴【正大国际】【ＷAV+CUE】

2024/9/28

一句话新闻

苹果官宣WWDC 2024！预计会有大批AI功能 - 2024/9/28

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。

首次推出的GDDR7内存模块密度为16GB，每个模块容量为2GB。其速度预设为32 Gbps（PAM3），但也可以降至28 Gbps，以提高产量和初始阶段的整体性能和成本效益。
据三星表示，GDDR7内存的能效将提高20%，同时工作电压仅为1.1V，低于标准的1.2V。通过采用更新的封装材料和优化的电路设计，使得在高速运行时的发热量降低，GDDR7的热阻比GDDR6降低了70%。

更新日志

2024年09月28日

如何在Win10系统使用Python3连接Hive

如何使用Python自动生成报表并以邮件发送

Python进行特征提取的示例代码

评论“如何在Win10系统使用Python3连接Hive”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

如何在Win10系统使用Python3连接Hive

如何使用Python自动生成报表并以邮件发送

Python进行特征提取的示例代码

评论“如何在Win10系统使用Python3连接Hive”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存