1. 架构图

2. 配置前提

2.1 配置VPC

请参考VPC配置文档:使用CLI创建VPC
同时创建一个安全组,并且至少保留一条入栈访问规则为所有流量,本条规则的目的本安全组ID。

2.2 准备好SQLDatabase

JDBC:jdbc:sqlserver://azuresql2021admin.database.windows.net:1433;database=azuresql
用户名:azure
密码:xxxx

2.3 将VPC中的NAT的EIP添加到SQL Database的防火墙

3. 创建Glue使用的Role

打开AWS portal:https://amazonaws-china.com/cn/,并且登陆
选择Service-> 安全性、身份与合规性->IAM服务

选择角色->添加角色

选择为Glue创建角色

为了配置方便,选择AdministratorAccess权限,实际项目中,依据具体需求配置权限。

标签页选择下一步
输入role的名称,比如:AWSGlueServiceRoleDefault

点击下一步,创建完成。

4. AWS Glue连接配置

选择Service-> 分析服务->AWS Glue

选择连接->添加连接

输入连接名称:JDBC,选择连接类型:JDBC,点击下一步

输入步骤2.2中获取的信息,注意:database要改成databaseName
选择步骤2.1中准备的子网,注意,这里要选择私有子网,即路由表指向NAT Gateway的子网。
选择步骤2.1准备的安全组,点击下一步

最后点击完成

在Glue页面中的连接选项卡,选中刚才创建的连接,点击测试连接

选择步骤3中创建的角色,点击测试连接

如果配置没有问题,会显示成功

5. AWS Glue 爬网程序

选择Service-> 分析服务->AWS Glue

选择爬网程序->添加爬网程序

输入爬网程序名称:JDBC-Test

点击下一步

选择数据存储为JDBC,连接也为JDBC,包含路径为%,点击下一步

添加另一个数据存储为否,直接点击下一步

选择角色为步骤3中的角色

选择按需运行

在输出页面,选择添加数据库

添加数据库页面,数据库名称为garydb

爬网输出页面选择刚才添加的数据库garydb,添加前缀为0320_

Review后,点击完成

在爬网程序页面,选择刚才创建的JDBC-Test爬网程序,点击运行爬网程序。

运行完成后,点击数据库->表,可以看到刚才爬网程序爬出来的表

©著作权归作者所有:来自51CTO博客作者villain21的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. 企业建站为什么要选择云服务器?这些常识你要知道!
  2. 新手建站如何挑选云服务器?
  3. 技多不压身,手把手教你零基础秒上手成为数据可视化老司机
  4. Unity平台 | 快速集成华为AGC云数据库服务
  5. 原创投稿 | 如何选择虚拟化方案与软件?
  6. 排序算法——选择排序
  7. windows10打不开应用商店
  8. Java怎么配置环境变量?
  9. 2021-03-15:手写代码:单链表选择排序。

随机推荐

  1. 急、急、急 phpexcel导入excel到mysql出
  2. 如何用SQL语句在一个已有数据库内新建一
  3. 在SQL Server CLR中托管.NET方法
  4. microsoft sqlserver2008 R2试用期结束后
  5. sql server执行存储过程慢的问题
  6. 如何从表中为每一行运行查询?
  7. linux系统下mysql快速安装使用、远程访问
  8. 快速开启MySQL慢日志查询的方法
  9. SQL Server Configuration Manager打不开
  10. 如何把当天的实时行情整理为1分钟线