YNOTES笔记

#### 创建ssh用户 ```sh local-user abc password simple 123456 authorization-attribute user-role 10 undo authorization-attribute user-role network-operator authorization-attribute user-role network-admin service-type ssh ``` #### 开启ssh ```sh ssh server enable ``` #### 配置ssh ```sh user-interface vty 9 15 authentication-mode scheme user-role level-15 user-role network-admin protocol inbound ssh ``` #### 配置ip地址 ```sh interface vlan-interface 1 undo ip address #删除ip地址 ip address 172.16.14.254 255.255.255.0 #配置静态ip ``` #### 配置dhcp ```sh interface vlan-interface 1 ipaddress dhcp-alloc #管理VLAN接口通过DHCP方式获取IP地址 undoip address dhcp-alloc ``` #### 配置镜像端口 `g1/0/16的接口加入到镜像组，g1/0/3为监控口` ```sh mirroring-group 1 local mirroring-group 1 mirroring-port gigabitethernet 1/0/16 both mirroring-group 1 monitor-port gigabitethernet 1/0/3 display mirroring-group all ```

[下载frp](https://github.com/fatedier/frp) #### 服务端配置(有公网ip的服务器) frps.ini ```sh [common] bind_port = 10000 ``` 启动 ```sh /opt/frp/frps -c /opt/frp/frps.ini ``` #### 客户端配置 frpc.ini ```sh [common] server_addr = x.x.x.x server_port = 10000 [ssh] type = tcp local_ip = 127.0.0.1 #本地ip local_port = 8080 #本地服务端口 remote_port = 6060 #服务器提供转发的端口 ``` 启动 ```sh /opt/frp/frpc -c /opt/frp/frpc.ini ```

#### 关闭zookeeper参数 ```sh enableSecurity (Enable Kerberos Authentication) False (uncheck) ``` #### 关闭hbase参数 ```sh hadoop.security.authentication Simple hadoop.security.authorization False (uncheck) dfs.datanode.address from 1004 (for Kerberos) to 50010 (default) dfs.datanode.http.address from 1006 (for Kerberos) to 50075 (default) Data Directory Permissions from 700 to 755 ``` #### 关闭kafka参数 ```sh kerberos.auth.enable False ``` #### 关闭yarn参数 ```sh yarn.nodemanager.linux-container-executor.nonsecure-mode.local-user yarn yarn.nodemanager.linux-container-executor.nonsecure-mode.limit-users false ``` #### 重启相关服务 #### 问题 `问题一、failure controller服务报code:NOAUTH for path /hadoop-ha/nameservice1/ActiveStandbyElectorLock` 分析:zookeeper查看getAcl /hadoop-ha，failure controller节点无权限访问读取该节点解决方法:添加zookeeper权限检查参数、删除rmr /hadoop-ha,初始化故障转移Znode ```sh 1.添加-Dzookeeper.skipACL=yes配置项(打开zookeeper配置，搜索java关键字) 2.重启zookeeper服务 3.登录zkcli删除zkfc znode:rmr /hadoop-ha/nameservice-test1 4.删除-Dzookeeper.skipACL=yes配置项 5.重启zookeeper及相应服务 6.初始化故障转移Znode ```

#### 创建DF的流程定义RDD ```sh 方式一: sc.textFile(文件.txt)-->RDD 方式二: nums = [1,2,3,4,5] rdd = sc.parallelize(nums) ``` 定义rowRDD ```sh rowRDD = peopleRDD.map(lambda line : line.split(',')).map(lambda attributes : Row(attributes[0], attributes[1])) ``` 定义structField结构 ```sh StructField(fieldName, StringType(), nullable = True) ``` 定义structType结构 ```sh struct_type = StructType([StructField('name', StringType(), nullable = True),StructField('age', StringType(), nullable = True)]) ``` 定义DataFrame ```sh PeopleDF=spark.createDataFrame(rowRDD, struct_type) ``` #### tempView和DF、RDD之间的转换 DF到tempView ```sh peopleTempView=peopleDF.createOrReplaceTempView("people") ``` tempView到DataFrame ```sh PeopleDF = spark.sql("SELECT * FROM people") ``` DataFrame到RDD ```sh PeopleDF.rdd.map(lambda attributes : "name: " + attributes[0]+","+"age:"+attributes[1]) ``` #### 加载json文件生成DataFrame ```sh peopleDF2 = spark.read.format("json").load("people.json") ``` #### DataFrame保持csv文件 ```sh peopleDF2.select("name", "age").write.format("csv").save("newpeople.csv") ``` #### 读取parquet文件生成DataFrame ```sh parquetFileDF = spark.read.parquet("users.parquet") ``` #### DataFrame保存成parquet文件 ```sh parquetFileDF.write.parquet("newpeople.parquet") ``` #### 读取jdbc生成DataFrame ```sh jdbcDF = spark.read.format("jdbc").option("url", "jdbc:mysql://localhost:3306/test").option("driver","com.mysql.jdbc.Driver").option("dbtable", "student").option("user", "root").option("password", "root").load() jdbcDF.show() ``` ```sh +---+----------+------+----+ | id| name|gender| age| +---+----------+------+----+ | 1| test| null|null| | 2|sheyisnong| null|null| +---+----------+------+----+ ``` #### DataFrame数据写入jdbc ```sh from pyspark.sql.types import Row from pyspark.sql.types import StructType from pyspark.sql.types import StructField from pyspark.sql.types import StringType from pyspark.sql.types import IntegerType studentRDD = spark.sparkContext.parallelize(["3 Rongcheng M 26","4 Guanhua M 27"]).map(lambda line : line.split(" ")) //下面要设置模式信息 schema = StructType([StructField("name", StringType(), True),StructField("gender", StringType(), True),StructField("age",IntegerType(), True)]) rowRDD = studentRDD.map(lambda p : Row(p[1].strip(), p[2].strip(),int(p[3]))) //建立起Row对象和模式之间的对应关系，也就是把数据和模式对应起来 studentDF = spark.createDataFrame(rowRDD, schema) prop = {} prop['user'] = 'root' prop['password'] = 'root' prop['driver'] = "com.mysql.jdbc.Driver" studentDF.write.jdbc("jdbc:mysql://localhost:3306/test",'student','append', prop) ``` 查看数据库数据 ```sql MariaDB [test]> select * from student; +----+------------+--------+------+ | id | name | gender | age | +----+------------+--------+------+ | 1 | test | NULL | NULL | | 2 | sheyisnong | NULL | NULL | | 3 | Rongcheng | M | 26 | | 4 | Guanhua | M | 27 | +----+------------+--------+------+ 4 rows in set (0.00 sec) ```