├── src
    ├── scala
    │   ├── config
    │   │   ├── vars.prod.properties
    │   │   └── vars.sit.properties
    │   ├── examples
    │   │   ├── Example1.scala
    │   │   └── Example2.scala
    │   ├── models
    │   │   ├── FeatureBuilder.scala
    │   │   └── ItemEmbedding.scala
    │   ├── core
    │   │   ├── BaseSparkOnline.scala
    │   │   └── BaseSparkLocal.scala
    │   ├── prediction
    │   │   ├── ItemEmbeddingPredictor.scala
    │   │   ├── PredictUserVector.scala
    │   │   └── PredictUserVectorTwo.scala
    │   └── data
    │   │   ├── MakeDataOne.scala
    │   │   └── MakeDataTwo.scala
    └── python
    │   ├── examples
    │       ├── example2.py
    │       └── example1.py
    │   ├── data
    │       ├── tfrecords_methods
    │       │   ├── tfrecords
    │       │   │   └── data1.tfrecords
    │       │   ├── data2tfrecord1.py
    │       │   ├── read_sparse_tfrecords_2.py
    │       │   └── read_sparse_tfrecords_1.py
    │       ├── read_tfrecords.py
    │       └── data2tfrecords.py
    │   ├── utils
    │       └── tensor_board.py
    │   ├── reference
    │       ├── feature_column.py
    │       └── self_defined_network_layer.py
    │   └── models
    │       ├── load_dnn_model.py
    │       └── dnn.py
├── requirements.txt
├── data
    ├── tfrecords
    │   └── tfrecords
    │   │   ├── train
    │   │       └── train.tfrecords
    │   │   └── evaluation
    │   │       └── evaluation.tfrecords
    └── checkpoints
    │   └── ckpt
    │       ├── events.out.tfevents.1575536459.CNHQ-18076444T
    │       ├── eval
    │           └── events.out.tfevents.1575536462.CNHQ-18076444T
    │       └── checkpoint
├── docs
    ├── Deep Neural Networks for YouTube Recommendations.pdf
    └── architecture.drawio
├── .gitignore
├── README.md
└── pom.xml


/src/scala/config/vars.prod.properties:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/src/scala/config/vars.sit.properties:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/src/python/examples/example2.py:
--------------------------------------------------------------------------------
1 | import tensorflow as tf
2 | 
3 | 


--------------------------------------------------------------------------------
/requirements.txt:
--------------------------------------------------------------------------------
1 | tensorflow>=2.0.0
2 | numpy>=1.19.0
3 | pandas>=1.3.0
4 | matplotlib>=3.3.0
5 | seaborn>=0.11.0
6 | scikit-learn>=1.0.0
7 | 


--------------------------------------------------------------------------------
/data/tfrecords/tfrecords/train/train.tfrecords:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/chenxingqiang/YouTube-DNN-RecSys/HEAD/data/tfrecords/tfrecords/train/train.tfrecords


--------------------------------------------------------------------------------
/data/tfrecords/tfrecords/evaluation/evaluation.tfrecords:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/chenxingqiang/YouTube-DNN-RecSys/HEAD/data/tfrecords/tfrecords/evaluation/evaluation.tfrecords


--------------------------------------------------------------------------------
/docs/Deep Neural Networks for YouTube Recommendations.pdf:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/chenxingqiang/YouTube-DNN-RecSys/HEAD/docs/Deep Neural Networks for YouTube Recommendations.pdf


--------------------------------------------------------------------------------
/src/python/data/tfrecords_methods/tfrecords/data1.tfrecords:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/chenxingqiang/YouTube-DNN-RecSys/HEAD/src/python/data/tfrecords_methods/tfrecords/data1.tfrecords


--------------------------------------------------------------------------------
/data/checkpoints/ckpt/events.out.tfevents.1575536459.CNHQ-18076444T:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/chenxingqiang/YouTube-DNN-RecSys/HEAD/data/checkpoints/ckpt/events.out.tfevents.1575536459.CNHQ-18076444T


--------------------------------------------------------------------------------
/data/checkpoints/ckpt/eval/events.out.tfevents.1575536462.CNHQ-18076444T:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/chenxingqiang/YouTube-DNN-RecSys/HEAD/data/checkpoints/ckpt/eval/events.out.tfevents.1575536462.CNHQ-18076444T


--------------------------------------------------------------------------------
/data/checkpoints/ckpt/checkpoint:
--------------------------------------------------------------------------------
1 | model_checkpoint_path: "model.ckpt-1600"
2 | all_model_checkpoint_paths: "model.ckpt-1200"
3 | all_model_checkpoint_paths: "model.ckpt-1300"
4 | all_model_checkpoint_paths: "model.ckpt-1400"
5 | all_model_checkpoint_paths: "model.ckpt-1500"
6 | all_model_checkpoint_paths: "model.ckpt-1600"
7 | 


--------------------------------------------------------------------------------
/src/scala/examples/Example1.scala:
--------------------------------------------------------------------------------
 1 | package example
 2 | 
 3 | import sparkapplication.BaseSparkLocal
 4 | import scala.collection.mutable
 5 | 
 6 | object Example1 extends BaseSparkLocal {
 7 |   def main(args:Array[String]):Unit = {
 8 |     val spark = this.basicSpark
 9 |     import spark.implicits._
10 | 
11 | 
12 | 
13 | 
14 | 
15 | 
16 | 
17 | 
18 | 
19 | 
20 | 
21 | 
22 | 
23 | 
24 | 
25 | 
26 | 
27 | 
28 | 
29 |   }
30 | }
31 | 


--------------------------------------------------------------------------------
/src/python/examples/example1.py:
--------------------------------------------------------------------------------
 1 | # -*- coding: utf-8 -*-
 2 | 
 3 | import os
 4 | import json
 5 | import tensorflow as tf
 6 | 
 7 | a = tf.constant([[0.1, 0.2], [0.3, 0.4], [0.5, 0.6]])   #3*2
 8 | b = tf.constant([[1, 0], [2, 1], [0, 1]])  #3*2
 9 | c = tf.nn.embedding_lookup(a, b)
10 | d = tf.reduce_mean(c, axis=1)
11 | e = tf.concat([d, a], 1)
12 | 
13 | with tf.Session() as sess:
14 |     print(c)
15 |     print(sess.run(c))
16 |     print(d)
17 |     print(sess.run(d))
18 |     print(e)
19 |     print(sess.run(e))
20 | 
21 | 


--------------------------------------------------------------------------------
/src/scala/examples/Example2.scala:
--------------------------------------------------------------------------------
 1 | package example
 2 | 
 3 | import sparkapplication.BaseSparkLocal
 4 | 
 5 | object Example2 extends BaseSparkLocal {
 6 |   def main(args:Array[String]):Unit = {
 7 | //    val spark = this.basicSpark
 8 | //    import spark.implicits._
 9 | 
10 |     val gdsVector = "[8534.033203125,-6634.611328125,-20669.0703125,-9483.734375,8790.3935546875,15647.646484375,-15543.39453125,34464.3203125,-1275.48974609375,28998.267578125,2446.0126953125,32628.033203125,1429.67431640625,37169.6640625,1902.3770751953125,-31038.359375]"
11 |     val gds123 = gdsVector.replace("[", "").replace("]", "").split(",", -1).map(_.toDouble)
12 |     gds123.foreach(println(_))
13 | 
14 |   }
15 | }
16 | 


--------------------------------------------------------------------------------
/src/scala/models/FeatureBuilder.scala:
--------------------------------------------------------------------------------
 1 | package explore
 2 | 
 3 | import org.tensorflow.example._
 4 | import org.tensorflow.spark.shaded.com.google.protobuf.ByteString
 5 | 
 6 | object FeatureBuilder {
 7 |   def s(strings: String*): Feature = {
 8 |     val b = BytesList.newBuilder
 9 |     for (s <- strings) {
10 |       b.addValue(ByteString.copyFromUtf8(s))
11 |     }
12 |     Feature.newBuilder.setBytesList(b).build
13 |   }
14 | 
15 |   def f(values: Float*): Feature = {
16 |     val b = FloatList.newBuilder
17 |     for (v <- values) {
18 |       b.addValue(v)
19 |     }
20 |     Feature.newBuilder.setFloatList(b).build
21 |   }
22 | 
23 |   def i(values: Int*): Feature = {
24 |     val b = Int64List.newBuilder
25 |     for (v <- values) {
26 |       b.addValue(v)
27 |     }
28 |     Feature.newBuilder.setInt64List(b).build
29 |   }
30 | }
31 | 


--------------------------------------------------------------------------------
/src/scala/core/BaseSparkOnline.scala:
--------------------------------------------------------------------------------
 1 | package sparkapplication
 2 | 
 3 | import org.apache.spark.SparkConf
 4 | import org.apache.spark.sql.SparkSession
 5 | 
 6 | trait BaseSparkOnline {
 7 |   def basicSpark: SparkSession =
 8 |     SparkSession
 9 |       .builder
10 |       .config(getSparkConf)
11 |       .enableHiveSupport()
12 |       .getOrCreate()
13 | 
14 |   def getSparkConf: SparkConf = {
15 |     val conf = new SparkConf()
16 |     conf.set("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
17 |       .set("spark.network.timeout", "6000")
18 |       .set("spark.streaming.kafka.maxRatePerPartition", "200000")
19 |       .set("spark.streaming.kafka.consumer.poll.ms", "5120")
20 |       .set("spark.streaming.concurrentJobs", "5")
21 |       .set("spark.sql.crossJoin.enabled", "true")
22 |       .set("spark.driver.maxResultSize", "20g")
23 |       .set("spark.rpc.message.maxSize", "1000") // 1024 max
24 |   }
25 | 
26 | }
27 | 


--------------------------------------------------------------------------------
/src/scala/core/BaseSparkLocal.scala:
--------------------------------------------------------------------------------
 1 | package sparkapplication
 2 | 
 3 | import org.apache.spark.SparkConf
 4 | import org.apache.spark.sql.SparkSession
 5 | 
 6 | trait BaseSparkLocal {
 7 |   //本地
 8 |   def basicSpark: SparkSession =
 9 |     SparkSession
10 |       .builder
11 |       .config(getSparkConf)
12 |       .master("local[1]")
13 |       .getOrCreate()
14 | 
15 |   def getSparkConf: SparkConf = {
16 |     val conf = new SparkConf()
17 |     conf.set("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
18 |       .set("spark.network.timeout", "600")
19 |       .set("spark.streaming.kafka.maxRatePerPartition", "200000")
20 |       .set("spark.streaming.kafka.consumer.poll.ms", "5120")
21 |       .set("spark.streaming.concurrentJobs", "5")
22 |       .set("spark.sql.crossJoin.enabled", "true")
23 |       .set("spark.driver.maxResultSize", "1g")
24 |       .set("spark.rpc.message.maxSize", "1000") // 1024 max
25 |     conf
26 |   }
27 | }
28 | 


--------------------------------------------------------------------------------
/src/python/utils/tensor_board.py:
--------------------------------------------------------------------------------
 1 | # -*- coding: utf-8 -*-
 2 | 
 3 | import tensorflow as tf
 4 | import sys
 5 | from tensorflow.python.platform import gfile
 6 | from tensorflow.core.protobuf import saved_model_pb2
 7 | from tensorflow.python.util import compat
 8 | 
 9 | # 运行完后, tensorboard --logdir ./logdir, 然后在浏览器中输入地址: http://localhost:6006/
10 | with tf.Session() as sess:
11 |     model_filename ='../../data/checkpoints/modelpath/1575536466/saved_model.pb'
12 |     with gfile.FastGFile(model_filename, 'rb') as f:
13 |         data = compat.as_bytes(f.read())
14 |         sm = saved_model_pb2.SavedModel()
15 |         sm.ParseFromString(data)
16 | 
17 |     if 1 != len(sm.meta_graphs):
18 |         print('More than one graph found. Not sure which to write')
19 |         sys.exit(1)
20 | 
21 |     g_in = tf.import_graph_def(sm.meta_graphs[0].graph_def)
22 |     LOGDIR='../../data/checkpoints/logdir'
23 |     train_writer = tf.summary.FileWriter(LOGDIR)
24 |     train_writer.add_graph(sess.graph)
25 |     train_writer.flush()
26 |     train_writer.close()


--------------------------------------------------------------------------------
/.gitignore:
--------------------------------------------------------------------------------
 1 | # Python
 2 | __pycache__/
 3 | *.py[cod]
 4 | *$py.class
 5 | *.so
 6 | .Python
 7 | build/
 8 | develop-eggs/
 9 | dist/
10 | downloads/
11 | eggs/
12 | .eggs/
13 | lib/
14 | lib64/
15 | parts/
16 | sdist/
17 | var/
18 | wheels/
19 | *.egg-info/
20 | .installed.cfg
21 | *.egg
22 | MANIFEST
23 | 
24 | # Jupyter Notebook
25 | .ipynb_checkpoints
26 | 
27 | # pyenv
28 | .python-version
29 | 
30 | # Environments
31 | .env
32 | .venv
33 | env/
34 | venv/
35 | ENV/
36 | env.bak/
37 | venv.bak/
38 | 
39 | # IDE
40 | .vscode/
41 | .idea/
42 | *.swp
43 | *.swo
44 | *~
45 | 
46 | # OS
47 | .DS_Store
48 | .DS_Store?
49 | ._*
50 | .Spotlight-V100
51 | .Trashes
52 | ehthumbs.db
53 | Thumbs.db
54 | 
55 | # TensorFlow
56 | *.ckpt
57 | *.meta
58 | *.data-00000-of-00001
59 | *.index
60 | *.pb
61 | *.pbtxt
62 | 
63 | # Logs
64 | *.log
65 | logdir/
66 | tensorboard_logs/
67 | 
68 | # Data
69 | 
70 | 
71 | 
72 | # Scala/Java
73 | target/
74 | *.class
75 | *.jar
76 | *.war
77 | *.ear
78 | *.zip
79 | *.tar.gz
80 | *.rar
81 | hs_err_pid*
82 | 
83 | # Maven
84 | .mvn/
85 | mvnw
86 | mvnw.cmd
87 | 


--------------------------------------------------------------------------------
/src/python/data/tfrecords_methods/data2tfrecord1.py:
--------------------------------------------------------------------------------
 1 | import numpy as np
 2 | import tensorflow as tf
 3 | 
 4 | if __name__ == "__main__":
 5 |     per_item_sample_num = 20
 6 |     item_num = 15
 7 |     embedding_size = 8
 8 |     filename = "../../data/tfrecords_methods/tfrecords/data1.tfrecords"
 9 |     writer = tf.python_io.TFRecordWriter(filename)
10 |     for i in range(per_item_sample_num):
11 |         for j in range(item_num):
12 |             embedding_average = np.random.uniform(low=j, high=j + 1.0, size=[embedding_size])
13 |             index = j
14 |             example = tf.train.Example(features=tf.train.Features(feature={
15 |                 "embedding_average": tf.train.Feature(float_list=tf.train.FloatList(value=embedding_average)),
16 |                 "index": tf.train.Feature(int64_list=tf.train.Int64List(value=[index])),
17 |                 "value": tf.train.Feature(float_list=tf.train.FloatList(value=[1.0])),
18 |                 "size": tf.train.Feature(int64_list=tf.train.Int64List(value=[item_num]))
19 |             }))
20 |             writer.write(example.SerializeToString())
21 |     writer.close()


--------------------------------------------------------------------------------
/src/python/data/read_tfrecords.py:
--------------------------------------------------------------------------------
 1 | import tensorflow as tf
 2 | 
 3 | def parse_fn(example):
 4 |     example_fmt = {
 5 |         "visit_items_index": tf.FixedLenFeature([5], tf.int64),
 6 |         "continuous_features_value": tf.FixedLenFeature([16], tf.float32),
 7 |         "next_visit_item_index": tf.FixedLenFeature([], tf.int64)
 8 |     }
 9 |     parsed = tf.parse_single_example(example, example_fmt)
10 |     next_visit_item_index = parsed.pop("next_visit_item_index")
11 |     return parsed, next_visit_item_index
12 | 
13 | if __name__ == "__main__":
14 |     files = tf.data.Dataset.list_files('../../data/tfrecords/train/train.tfrecords', shuffle=True)
15 |     data_set = files.apply(
16 |         tf.contrib.data.parallel_interleave(
17 |             lambda filename: tf.data.TFRecordDataset(filename),
18 |             cycle_length=16))
19 |     data_set = data_set.repeat(1)
20 |     data_set = data_set.map(map_func=parse_fn, num_parallel_calls=16)
21 |     data_set = data_set.prefetch(buffer_size=64)
22 |     data_set = data_set.batch(batch_size=16)
23 |     iterator = data_set.make_one_shot_iterator()
24 |     res1, res2 = iterator.get_next()
25 | 
26 |     with tf.Session() as sess:
27 |         for i in range(5):
28 |             result1, result2 = sess.run([res1, res2])
29 |             print("第{}批:".format(i), end=" ")
30 |             print("result1是:", result1)
31 |             print("result2是:", result2)


--------------------------------------------------------------------------------
/src/python/data/tfrecords_methods/read_sparse_tfrecords_2.py:
--------------------------------------------------------------------------------
 1 | import tensorflow as tf
 2 | 
 3 | def parse_fn(example):
 4 |     example_fmt = {
 5 |         "embedding_average": tf.FixedLenFeature([8], tf.float32),
 6 |         "one_hot": tf.SparseFeature(index_key=["index"],
 7 |                                     value_key="value",
 8 |                                     dtype=tf.float32,
 9 |                                     size=[15])   # size必须写死, 不能传超参
10 |     }
11 |     parsed = tf.parse_single_example(example, example_fmt)
12 |     return parsed["embedding_average"], tf.sparse_tensor_to_dense(parsed["one_hot"])
13 | 
14 | if __name__ == "__main__":
15 |     files = tf.data.Dataset.list_files('../../data/tfrecords_methods/tfrecords/data1.tfrecords', shuffle=True)
16 |     data_set = files.apply(
17 |         tf.contrib.data.parallel_interleave(
18 |             lambda filename: tf.data.TFRecordDataset(filename),
19 |             cycle_length=15))
20 |     data_set = data_set.repeat(1)
21 |     data_set = data_set.map(map_func=parse_fn, num_parallel_calls=15)
22 |     data_set = data_set.prefetch(buffer_size=30)
23 |     data_set = data_set.batch(batch_size=15)
24 |     iterator = data_set.make_one_shot_iterator()
25 |     embedding, one_hot = iterator.get_next()
26 | 
27 |     with tf.Session() as sess:
28 |         for i in range(5):
29 |             embedding_result, one_hot_result = sess.run([embedding, one_hot])
30 |             print("第{}批:".format(i), end=" ")
31 |             print("embedding是:", embedding_result, end=" ")
32 |             print("one_hot是:", one_hot_result)


--------------------------------------------------------------------------------
/src/python/data/tfrecords_methods/read_sparse_tfrecords_1.py:
--------------------------------------------------------------------------------
 1 | import tensorflow as tf
 2 | 
 3 | def parse_fn(example):
 4 |     example_fmt = {
 5 |         "embedding_average": tf.FixedLenFeature([8], tf.float32),
 6 |         "index": tf.FixedLenFeature([], tf.int64),
 7 |         "value": tf.FixedLenFeature([], tf.float32),
 8 |         "size": tf.FixedLenFeature([], tf.int64)
 9 |     }
10 |     parsed = tf.parse_single_example(example, example_fmt)
11 |     sparse_tensor = tf.SparseTensor([[parsed["index"]]], [parsed["value"]], [parsed["size"]])   # 这种方法读取稀疏向量在有的平台可能不行
12 |     return parsed["embedding_average"], tf.sparse_tensor_to_dense(sparse_tensor)
13 | 
14 | if __name__ == "__main__":
15 |     files = tf.data.Dataset.list_files('../../data/tfrecords_methods/tfrecords/data1.tfrecords', shuffle=True)
16 |     data_set = files.apply(
17 |         tf.contrib.data.parallel_interleave(
18 |             lambda filename: tf.data.TFRecordDataset(filename),
19 |             cycle_length=15))
20 |     data_set = data_set.repeat(1)
21 |     data_set = data_set.map(map_func=parse_fn, num_parallel_calls=15)
22 |     data_set = data_set.prefetch(buffer_size=30)
23 |     data_set = data_set.batch(batch_size=15)
24 |     iterator = data_set.make_one_shot_iterator()
25 |     embedding, one_hot = iterator.get_next()
26 | 
27 |     with tf.Session() as sess:
28 |         for i in range(5):
29 |             embedding_result, one_hot_result = sess.run([embedding, one_hot])
30 |             print("第{}批:".format(i), end=" ")
31 |             print("embedding是:", embedding_result, end=" ")
32 |             print("one_hot是:", one_hot_result)


--------------------------------------------------------------------------------
/src/scala/models/ItemEmbedding.scala:
--------------------------------------------------------------------------------
 1 | package explore
 2 | 
 3 | import org.tensorflow._
 4 | import sparkapplication.BaseSparkOnline
 5 | import scala.collection.JavaConverters._
 6 | 
 7 | object ItemEmbeddingMakeDataOne extends BaseSparkOnline {
 8 |   def main(args:Array[String]):Unit = {
 9 |     val spark = this.basicSpark
10 |     import spark.implicits._
11 | 
12 |     val modelHdfsPath = "hdfs路径"
13 |     val modelTag = "serve"
14 | 
15 |     val embeddingAverageArray = Array(Array.fill[Float](8)(0.1F))
16 |     val model = SavedModelBundle.load(modelHdfsPath, modelTag)
17 |     val sess = model.session()
18 |     val embeddingAverageArrayTensor = Tensor.create(embeddingAverageArray, classOf[java.lang.Float])
19 |     val itemEmbeddingResult = getItemEmbedding(sess, embeddingAverageArrayTensor)
20 | 
21 |     val result = spark.sparkContext.parallelize(itemEmbeddingResult.map(k => k.mkString("@"))).toDF("item_embedding")
22 |     result.show(10, false)
23 |   }
24 | 
25 |   private def getItemEmbedding(sess: Session, embeddingAverageArrayTensor: Tensor[_], embeddingAverageArrayName: String = "Placeholder:0", itemEmbeddingName: String = "item_embedding:0") = {
26 |     val resultBuffer = sess.runner
27 |       .feed(embeddingAverageArrayName, embeddingAverageArrayTensor)
28 |       .fetch(itemEmbeddingName)
29 |       .run.asScala
30 | 
31 |     val itemEmbedding = resultBuffer.head
32 |     val itemEmbeddingShape: Array[Int] = itemEmbedding.shape.map(_.toInt)
33 |     val itemEmbeddingResult = Array.ofDim[Float](itemEmbeddingShape.head, itemEmbeddingShape(1))
34 |     itemEmbedding.copyTo(itemEmbeddingResult)
35 | 
36 |     itemEmbeddingResult
37 |   }
38 | }
39 | 


--------------------------------------------------------------------------------
/src/scala/prediction/ItemEmbeddingPredictor.scala:
--------------------------------------------------------------------------------
 1 | package explore
 2 | 
 3 | import org.tensorflow._
 4 | import org.tensorflow.example._
 5 | import explore.FeatureBuilder._
 6 | import sparkapplication.BaseSparkOnline
 7 | import scala.collection.JavaConverters._
 8 | 
 9 | object ItemEmbeddingMakeDataTwo extends BaseSparkOnline {
10 |   def main(args:Array[String]):Unit = {
11 |     val spark = this.basicSpark
12 |     import spark.implicits._
13 | 
14 |     val modelHdfsPath = "hdfs路径"
15 |     val modelTag = "serve"
16 | 
17 |     val embeddingAverage = Array.fill[Float](8)(0.1F)
18 |     val gender = "male"
19 |     val cityCd = "city_cd_100"
20 |     val featuresBuilder = Features.newBuilder
21 |       .putFeature("embedding_average", f(embeddingAverage:_*))
22 |       .putFeature("gender", s(gender))
23 |       .putFeature("city_cd", s(cityCd))
24 |     featuresBuilder.build()
25 |     val features = Example.newBuilder.setFeatures(featuresBuilder).build.toByteArray
26 | 
27 |     val model = SavedModelBundle.load(modelHdfsPath, modelTag)
28 |     val sess = model.session()
29 |     val embeddingAverageArrayTensor = Tensor.create(Array(features))
30 |     val itemEmbeddingResult = getItemEmbedding(sess, embeddingAverageArrayTensor)
31 | 
32 |     val result = spark.sparkContext.parallelize(itemEmbeddingResult.map(k => k.mkString("@"))).toDF("item_embedding")
33 |     result.show(50, false)
34 |   }
35 | 
36 |   private def getItemEmbedding(sess: Session, featuresArrayTensor: Tensor[_], featuresArrayName: String = "input_example_tensor:0", itemEmbeddingName: String = "item_embedding:0") = {
37 |     val resultBuffer = sess.runner
38 |       .feed(featuresArrayName, featuresArrayTensor)
39 |       .fetch(itemEmbeddingName)
40 |       .run.asScala
41 | 
42 |     val itemEmbedding = resultBuffer.head
43 |     val itemEmbeddingShape: Array[Int] = itemEmbedding.shape.map(_.toInt)
44 |     val itemEmbeddingResult = Array.ofDim[Float](itemEmbeddingShape.head, itemEmbeddingShape(1))
45 |     itemEmbedding.copyTo(itemEmbeddingResult)
46 | 
47 |     itemEmbeddingResult
48 |   }
49 | }
50 | 


--------------------------------------------------------------------------------
/src/scala/prediction/PredictUserVector.scala:
--------------------------------------------------------------------------------
 1 | package explore
 2 | 
 3 | import org.tensorflow._
 4 | import sparkapplication.BaseSparkOnline
 5 | import scala.collection.JavaConverters._
 6 | 
 7 | object PredictUserVectorMakeDataOne extends BaseSparkOnline {
 8 |   def main(args:Array[String]):Unit = {
 9 |     val spark = this.basicSpark
10 |     import spark.implicits._
11 | 
12 |     val modelHdfsPath = "hdfs路径"
13 |     val modelTag = "serve"
14 | 
15 |     val dataValidation = spark.read.format("tfrecords")
16 |       .option("recordType", "Example")
17 |       .load("hdfs路径")
18 |       .rdd.map{row =>
19 |       val embeddingAverage = row.getAs[scala.collection.mutable.WrappedArray[Float]]("embedding_average")
20 |       embeddingAverage.toArray
21 |     }
22 |     println(s"验证集数据dataValidation总数为:${dataValidation.count},数据格式如下:")
23 |     dataValidation.toDF("embedding_average").show(5, false)
24 | 
25 |     val userVectorAll = dataValidation.mapPartitions(lineIterator => {
26 |       val embeddingAverageArray = lineIterator.toArray
27 |       val model = SavedModelBundle.load(modelHdfsPath, modelTag)
28 |       val sess = model.session()
29 |       val embeddingAverageArrayTensor = Tensor.create(embeddingAverageArray, classOf[java.lang.Float])
30 |       val userVectorResult = predictUserVector(sess, embeddingAverageArrayTensor)
31 |       userVectorResult.toIterator
32 |     })
33 | 
34 |     val result = userVectorAll.map(k => k.mkString("@")).toDF("user_vector")
35 |     result.show(10, false)
36 |   }
37 | 
38 |   private def predictUserVector(sess: Session, embeddingAverageArrayTensor: Tensor[_], embeddingAverageArrayName: String = "Placeholder:0", userVectorName: String = "user_vector/Relu:0") = {
39 |     val resultBuffer = sess.runner
40 |       .feed(embeddingAverageArrayName, embeddingAverageArrayTensor)
41 |       .fetch(userVectorName)
42 |       .run.asScala
43 | 
44 |     val userVector = resultBuffer.head
45 |     val userVectorShape: Array[Int] = userVector.shape.map(_.toInt)
46 |     val userVectorResult = Array.ofDim[Float](userVectorShape.head, userVectorShape(1))
47 |     userVector.copyTo(userVectorResult)
48 | 
49 |     userVectorResult
50 |   }
51 | 
52 | }
53 | 


--------------------------------------------------------------------------------
/src/python/reference/feature_column.py:
--------------------------------------------------------------------------------
 1 | import numpy as np
 2 | import tensorflow as tf
 3 | 
 4 | member_id = "member_id_{}".format(1)
 5 | gds_cd = "gds_cd_{}".format(1)
 6 | age = np.random.randint(18, 60)
 7 | height = np.random.uniform(170.0, 190.0)
 8 | example = tf.train.Example(features=tf.train.Features(feature={
 9 |     "member_id": tf.train.Feature(bytes_list=tf.train.BytesList(value=[tf.compat.as_bytes(member_id)])),
10 |     "gds_cd": tf.train.Feature(bytes_list=tf.train.BytesList(value=[tf.compat.as_bytes(gds_cd)])),
11 |     "age": tf.train.Feature(int64_list=tf.train.Int64List(value=[age])),
12 |     "height": tf.train.Feature(float_list=tf.train.FloatList(value=[height]))
13 | }))
14 | serialized_example = example.SerializeToString()
15 | 
16 | example_fmt = {
17 |     "member_id": tf.FixedLenFeature([1], tf.string),
18 |     "gds_cd": tf.FixedLenFeature([1], tf.string),
19 |     "age": tf.FixedLenFeature([1], tf.int64),
20 |     "height": tf.FixedLenFeature([1], tf.float32)
21 | }
22 | parsed = tf.parse_single_example(serialized_example, example_fmt)
23 | 
24 | member_id = tf.feature_column.categorical_column_with_hash_bucket("member_id", hash_bucket_size=3)
25 | gds_cd = tf.feature_column.categorical_column_with_hash_bucket("gds_cd", hash_bucket_size=3)
26 | age = tf.feature_column.categorical_column_with_vocabulary_list("age", [i for i in range(3)], dtype=tf.int64,
27 |                                                                 default_value=0)
28 | height = tf.feature_column.numeric_column("height")
29 | member_id_indicator = tf.feature_column.indicator_column(member_id)
30 | gds_cd_indicator = tf.feature_column.indicator_column(gds_cd)
31 | age_indicator = tf.feature_column.indicator_column(age)
32 | feature_columns = [member_id_indicator, gds_cd_indicator, age_indicator, height]
33 | _result = tf.feature_column.input_layer(parsed, feature_columns)
34 | 
35 | with tf.Session() as sess:
36 |     sess.run(tf.global_variables_initializer())
37 |     sess.run(tf.tables_initializer())
38 |     parsed_result = sess.run([parsed])
39 |     print("parsed_result是:", parsed_result)
40 |     result = sess.run([_result])
41 |     print("result是:", result)
42 | 
43 | 
44 | 
45 | 
46 | 
47 | 
48 | 
49 | 
50 | 
51 | 
52 | 


--------------------------------------------------------------------------------
/src/python/data/data2tfrecords.py:
--------------------------------------------------------------------------------
 1 | import numpy as np
 2 | import tensorflow as tf
 3 | 
 4 | if __name__ == "__main__":
 5 |     sample_num = 5000
 6 |     item_num = 500
 7 |     sample_set = []
 8 |     for i in range(sample_num):
 9 |         visit_items_index = np.random.randint(low=0, high=item_num, size=[5])
10 |         continuous_features_value = np.random.uniform(low=-5.0, high=5.0, size=[16])
11 |         next_visit_item_index = np.random.randint(low=0, high=item_num)
12 |         sample = [visit_items_index, continuous_features_value, next_visit_item_index]
13 |         sample_set.append(sample)
14 | 
15 |     # 训练数据
16 |     filename = "../../data/tfrecords/train/train.tfrecords"
17 |     writer = tf.python_io.TFRecordWriter(filename)
18 |     for sample in sample_set:
19 |         visit_items_index = sample[0]
20 |         continuous_features_value = sample[1]
21 |         next_visit_item_index = sample[2]
22 |         example = tf.train.Example(features=tf.train.Features(feature={
23 |             "visit_items_index": tf.train.Feature(int64_list=tf.train.Int64List(value=visit_items_index)),
24 |             "continuous_features_value": tf.train.Feature(
25 |                 float_list=tf.train.FloatList(value=continuous_features_value)),
26 |             "next_visit_item_index": tf.train.Feature(int64_list=tf.train.Int64List(value=[next_visit_item_index]))
27 |         }))
28 |         writer.write(example.SerializeToString())
29 |     writer.close()
30 | 
31 |     # 评估数据, 由于数据是随机生成, 所以评估数据从训练数据中取
32 |     filename = "../../data/tfrecords/evaluation/evaluation.tfrecords"
33 |     writer = tf.python_io.TFRecordWriter(filename)
34 |     i = 0
35 |     for sample in sample_set:
36 |         if i % 10 == 0:
37 |             visit_items_index = sample[0]
38 |             continuous_features_value = sample[1]
39 |             next_visit_item_index = sample[2]
40 |             example = tf.train.Example(features=tf.train.Features(feature={
41 |                 "visit_items_index": tf.train.Feature(int64_list=tf.train.Int64List(value=visit_items_index)),
42 |                 "continuous_features_value": tf.train.Feature(
43 |                     float_list=tf.train.FloatList(value=continuous_features_value)),
44 |                 "next_visit_item_index": tf.train.Feature(int64_list=tf.train.Int64List(value=[next_visit_item_index]))
45 |             }))
46 |             writer.write(example.SerializeToString())
47 |         i = i + 1
48 |     writer.close()


--------------------------------------------------------------------------------
/src/scala/data/MakeDataOne.scala:
--------------------------------------------------------------------------------
 1 | package explore
 2 | 
 3 | import java.util.Random
 4 | import org.apache.spark.sql._
 5 | import sparkapplication.BaseSparkOnline
 6 | import scala.collection.mutable.ArrayBuffer
 7 | 
 8 | object MakeDataOne extends BaseSparkOnline {
 9 |   def main(args:Array[String]):Unit = {
10 |     val spark = this.basicSpark
11 |     import spark.implicits._
12 | 
13 |     // 训练数据
14 |     var perItemSampleNum = 20
15 |     var itemNum = 15
16 |     var embeddingSize = 8
17 |     val trainData = ArrayBuffer[(Array[Double], Long, Double, Long)]()
18 |     for(i <- 0 until perItemSampleNum) {
19 |       for(j <- 0 until itemNum){
20 |         val embeddingAverage = Array.fill[Double](embeddingSize)(1.0*j + (new Random).nextDouble())
21 |         trainData.append((embeddingAverage, j.toLong, 1.0, itemNum.toLong))
22 |       }
23 |     }
24 |     val trainDataFrame = spark.sparkContext.parallelize(trainData, 10).toDF("embedding_average", "index", "value", "size")
25 | 
26 |     // Save DataFrame as TFRecords
27 |     trainDataFrame.write.mode(SaveMode.Overwrite).format("tfrecords").option("recordType", "Example").save("hdfs路径")
28 | 
29 |     // Read TFRecords into DataFrame.
30 |     val trainDataTfrecords: DataFrame = spark.read.format("tfrecords").option("recordType", "Example").load("hdfs路径")
31 |     println("trainDataFrame重新加载tfrecords格式的数据,数据格式如下:")
32 |     trainDataTfrecords.show(10, false)
33 | 
34 |     // 评估数据
35 |     perItemSampleNum = 10
36 |     itemNum = 15
37 |     embeddingSize = 8
38 |     val evaluationData = ArrayBuffer[(Array[Double], Long, Double, Long)]()
39 |     for(i <- 0 until perItemSampleNum) {
40 |       for(j <- 0 until itemNum){
41 |         val embeddingAverage = Array.fill[Double](embeddingSize)(1.0*j + (new Random).nextDouble())
42 |         evaluationData.append((embeddingAverage, j.toLong, 1.0, itemNum.toLong))
43 |       }
44 |     }
45 |     val evaluationDataFrame = spark.sparkContext.parallelize(evaluationData, 10).toDF("embedding_average", "index", "value", "size")
46 | 
47 |     // Save DataFrame as TFRecords
48 |     evaluationDataFrame.write.mode(SaveMode.Overwrite).format("tfrecords").option("recordType", "Example").save("hdfs路径")
49 | 
50 |     // Read TFRecords into DataFrame.
51 |     val evaluationDataTfrecords: DataFrame = spark.read.format("tfrecords").option("recordType", "Example").load("hdfs路径")
52 |     println("evaluationData重新加载tfrecords格式的数据,数据格式如下:")
53 |     evaluationDataTfrecords.show(10, false)
54 | 
55 |   }
56 | }
57 | 


--------------------------------------------------------------------------------
/src/scala/prediction/PredictUserVectorTwo.scala:
--------------------------------------------------------------------------------
 1 | package explore
 2 | 
 3 | import org.tensorflow._
 4 | import org.tensorflow.example._
 5 | import explore.FeatureBuilder._
 6 | import sparkapplication.BaseSparkOnline
 7 | import scala.collection.JavaConverters._
 8 | 
 9 | object PredictUserVectorMakeDataTwo extends BaseSparkOnline {
10 |   def main(args:Array[String]):Unit = {
11 |     val spark = this.basicSpark
12 |     import spark.implicits._
13 | 
14 |     val modelHdfsPath = "hdfs路径"
15 |     val modelTag = "serve"
16 | 
17 |     val dataValidation = spark.read.format("tfrecords")
18 |       .option("recordType", "Example")
19 |       .load("hdfs路径")
20 |       .rdd.map{row =>
21 |       val embeddingAverage = row.getAs[scala.collection.mutable.WrappedArray[Float]]("embedding_average").toArray
22 |       val gender = row.getAs[String]("gender")
23 |       val cityCd = row.getAs[String]("city_cd")
24 |       val featuresBuilder = Features.newBuilder
25 |         .putFeature("embedding_average", f(embeddingAverage:_*))
26 |         .putFeature("gender", s(gender))
27 |         .putFeature("city_cd", s(cityCd))
28 |       featuresBuilder.build()
29 |       val features = Example.newBuilder.setFeatures(featuresBuilder).build.toByteArray
30 |       features
31 |     }
32 |     println(s"验证集数据dataValidation总数为:${dataValidation.count},数据格式如下:")
33 |     dataValidation.toDF("features").show(5, false)
34 | 
35 |     val userVectorAll = dataValidation.mapPartitions(lineIterator => {
36 |       val featuresArray = lineIterator.toArray
37 |       val model = SavedModelBundle.load(modelHdfsPath, modelTag)
38 |       val sess = model.session()
39 |       val featuresArrayTensor = Tensor.create(featuresArray)
40 |       val userVectorResult = predictUserVector(sess, featuresArrayTensor)
41 |       userVectorResult.toIterator
42 |     })
43 | 
44 |     val result = userVectorAll.map(k => k.mkString("@")).toDF("user_vector")
45 |     result.show(10, false)
46 |   }
47 | 
48 |   private def predictUserVector(sess: Session, featuresArrayTensor: Tensor[_], featuresArrayName: String = "input_example_tensor:0", userVectorName: String = "user_vector/Relu:0") = {
49 |     val resultBuffer = sess.runner
50 |       .feed(featuresArrayName, featuresArrayTensor)
51 |       .fetch(userVectorName)
52 |       .run.asScala
53 | 
54 |     val userVector = resultBuffer.head
55 |     val userVectorShape: Array[Int] = userVector.shape.map(_.toInt)
56 |     val userVectorResult = Array.ofDim[Float](userVectorShape.head, userVectorShape(1))
57 |     userVector.copyTo(userVectorResult)
58 | 
59 |     userVectorResult
60 |   }
61 | 
62 | }
63 | 


--------------------------------------------------------------------------------
/src/scala/data/MakeDataTwo.scala:
--------------------------------------------------------------------------------
 1 | package explore
 2 | 
 3 | import java.util.Random
 4 | import org.apache.spark.sql._
 5 | import sparkapplication.BaseSparkOnline
 6 | import scala.collection.mutable.ArrayBuffer
 7 | 
 8 | object MakeDataTwo extends BaseSparkOnline {
 9 |   def main(args:Array[String]):Unit = {
10 |     val spark = this.basicSpark
11 |     import spark.implicits._
12 | 
13 |     // 训练数据
14 |     var perItemSampleNum = 20
15 |     var itemNum = 15
16 |     var embeddingSize = 8
17 |     val trainData = ArrayBuffer[(Array[Double], String, String, Long)]()
18 |     for(i <- 0 until perItemSampleNum) {
19 |       for(j <- 0 until itemNum){
20 |         val embeddingAverage = Array.fill[Double](embeddingSize)(1.0*j + (new Random).nextDouble())
21 |         val gender = if(j % 2 == 0) "male" else "female"
22 |         val cityCd = "city_cd_" + (new Random).nextInt(200).toString
23 |         trainData.append((embeddingAverage, gender, cityCd, j.toLong))
24 |       }
25 |     }
26 |     val trainDataFrame = spark.sparkContext.parallelize(trainData, 10).toDF("embedding_average", "gender", "city_cd", "index")
27 | 
28 |     // Save DataFrame as TFRecords
29 |     trainDataFrame.write.mode(SaveMode.Overwrite).format("tfrecords").option("recordType", "Example").save("hdfs路径")
30 | 
31 |     // Read TFRecords into DataFrame.
32 |     val trainDataTfrecords: DataFrame = spark.read.format("tfrecords").option("recordType", "Example").load("hdfs路径")
33 |     println("trainDataFrame重新加载tfrecords格式的数据,数据格式如下:")
34 |     trainDataTfrecords.show(10, false)
35 | 
36 |     // 评估数据
37 |     perItemSampleNum = 10
38 |     itemNum = 15
39 |     embeddingSize = 8
40 |     val evaluationData = ArrayBuffer[(Array[Double], String, String, Long)]()
41 |     for(i <- 0 until perItemSampleNum) {
42 |       for(j <- 0 until itemNum){
43 |         val embeddingAverage = Array.fill[Double](embeddingSize)(1.0*j + (new Random).nextDouble())
44 |         val gender = if(j % 2 == 0) "male" else "female"
45 |         val cityCd = "city_cd_" + (new Random).nextInt(200).toString
46 |         evaluationData.append((embeddingAverage, gender, cityCd, j.toLong))
47 |       }
48 |     }
49 |     val evaluationDataFrame = spark.sparkContext.parallelize(evaluationData, 10).toDF("embedding_average", "gender", "city_cd", "index")
50 | 
51 |     // Save DataFrame as TFRecords
52 |     evaluationDataFrame.write.mode(SaveMode.Overwrite).format("tfrecords").option("recordType", "Example").save("hdfs路径")
53 | 
54 |     // Read TFRecords into DataFrame.
55 |     val evaluationDataTfrecords: DataFrame = spark.read.format("tfrecords").option("recordType", "Example").load("hdfs路径")
56 |     println("evaluationData重新加载tfrecords格式的数据,数据格式如下:")
57 |     evaluationDataTfrecords.show(10, false)
58 | 
59 |   }
60 | }
61 | 


--------------------------------------------------------------------------------
/src/python/models/load_dnn_model.py:
--------------------------------------------------------------------------------
 1 | # -*- coding: utf-8 -*-
 2 | 
 3 | import tensorflow as tf
 4 | 
 5 | class dataProcess(object):
 6 | 
 7 |     def parse_fn(self, example):
 8 |         example_fmt = {
 9 |             "visit_items_index": tf.FixedLenFeature([5], tf.int64),
10 |             "continuous_features_value": tf.FixedLenFeature([16], tf.float32),
11 |             "next_visit_item_index": tf.FixedLenFeature([], tf.int64)
12 |         }
13 |         parsed = tf.parse_single_example(example, example_fmt)
14 |         parsed.pop("next_visit_item_index")
15 |         return parsed
16 | 
17 |     def next_batch(self, batch_size):
18 |         files = tf.data.Dataset.list_files(
19 |             '../../data/tfrecords/train/train.tfrecords', shuffle=False
20 |         )
21 |         data_set = files.apply(
22 |             tf.contrib.data.parallel_interleave(
23 |                 lambda filename: tf.data.TFRecordDataset(filename),
24 |                 cycle_length=16))
25 |         data_set = data_set.map(map_func=self.parse_fn, num_parallel_calls=16)
26 |         data_set = data_set.prefetch(buffer_size=256)
27 |         data_set = data_set.batch(batch_size=batch_size)
28 |         iterator = data_set.make_one_shot_iterator()
29 |         features = iterator.get_next()
30 |         return features
31 | 
32 | if __name__ == "__main__":
33 |     # 数据预处理#
34 |     dataProcess = dataProcess()
35 |     features = dataProcess.next_batch(batch_size=16)
36 | 
37 |     signature_key = tf.saved_model.signature_constants.DEFAULT_SERVING_SIGNATURE_DEF_KEY
38 |     with tf.Session() as sess:
39 |         meta_graph_def = tf.saved_model.loader.load(sess, [tf.saved_model.tag_constants.SERVING],
40 |                                                     "../../data/checkpoints/modelpath/1575536466")
41 |         print(meta_graph_def)
42 |         signature = meta_graph_def.signature_def
43 |         visit_items_index_tensor_name = signature[signature_key].inputs["visit_items_index"].name
44 |         visit_items_index_tensor = sess.graph.get_tensor_by_name(visit_items_index_tensor_name)
45 |         continuous_features_value_tensor_name = signature[signature_key].inputs["continuous_features_value"].name
46 |         continuous_features_value_tensor = sess.graph.get_tensor_by_name(continuous_features_value_tensor_name)
47 |         user_vector_tensor_name = signature[signature_key].outputs["user_vector"].name
48 |         user_vector_tensor = sess.graph.get_tensor_by_name(user_vector_tensor_name)
49 |         index_tensor_name = signature[signature_key].outputs["index"].name
50 |         index_tensor = sess.graph.get_tensor_by_name(index_tensor_name)
51 | 
52 |         features_result = sess.run(features)
53 |         feed_dict = {visit_items_index_tensor: features_result["visit_items_index"], continuous_features_value_tensor: features_result["continuous_features_value"]}
54 |         predict_outputs = sess.run([user_vector_tensor, index_tensor], feed_dict=feed_dict)
55 |         print(predict_outputs[0])
56 |         print("==========")
57 |         print(predict_outputs[1])


--------------------------------------------------------------------------------
/src/python/reference/self_defined_network_layer.py:
--------------------------------------------------------------------------------
 1 | # -*- coding: utf-8 -*-
 2 | 
 3 | import numpy as np
 4 | import tensorflow as tf
 5 | from tensorflow.python.keras import initializers
 6 | 
 7 | class SampleLayer(tf.keras.layers.Layer):
 8 |     def __init__(self, is_training, top_k, item_num,
 9 |                  kernel_initializer=tf.initializers.random_uniform(minval=-0.1, maxval=0.1), **kwargs):
10 |         self.is_training = is_training
11 |         self.top_k = top_k
12 |         self.item_num = item_num
13 |         self.kernel_initializer = kernel_initializer
14 |         super(SampleLayer, self).__init__(**kwargs)
15 | 
16 |     def build(self, input_shape):
17 |         assert isinstance(input_shape, list)
18 |         input_shape0 = input_shape[0]
19 |         # 为该层创建一个可训练的权重
20 |         partitioner = tf.compat.v1.fixed_size_partitioner(num_shards=int(input_shape0[1]))
21 |         self.kernel = self.add_weight(name="item_embedding",
22 |                                       shape=(self.item_num, int(input_shape0[1])),
23 |                                       initializer=self.kernel_initializer,
24 |                                       trainable=True,
25 |                                       partitioner=partitioner)
26 |         # 一定要在最后调用它
27 |         super(SampleLayer, self).build(input_shape)
28 | 
29 |     def train_output(self, inputs0, inputs1):
30 |         output_embedding = tf.nn.embedding_lookup(self.kernel, inputs1)  # num * embedding_size
31 |         logits = tf.matmul(inputs0, output_embedding, transpose_a=False, transpose_b=True)  # num * num
32 |         yhat = tf.nn.softmax(logits)  # num * num
33 |         cross_entropy = tf.reduce_mean(-tf.log(tf.matrix_diag_part(yhat) + 1e-16))
34 |         return cross_entropy
35 | 
36 |     def predict_output(self, inputs0):
37 |         logits_predict = tf.matmul(inputs0, self.kernel, transpose_a=False, transpose_b=True)  # num * item_num
38 |         yhat_predict = tf.nn.softmax(logits_predict)  # num * item_num
39 |         _, indices = tf.nn.top_k(yhat_predict, k=self.top_k, sorted=True)  # indices是: num * top_k
40 |         indices = tf.cast(indices, tf.float32)  # tf.keras.backend.switch输出类型必须一样, 所以将int转为float
41 |         return indices
42 | 
43 |     def func1(self, inputs):
44 |         assert len(inputs) == 2
45 |         inputs1 = tf.cast(inputs[1], tf.int32)
46 |         return inputs1
47 | 
48 |     def call(self, inputs, **kwargs):
49 |         assert isinstance(inputs, list)
50 |         inputs0 = inputs[0]  # 上一层的输出
51 |         inputs1_default = tf.zeros([inputs0.shape[0]], dtype=tf.int32)  # 另外一个输入, 这是默认值
52 |         inputs1 = tf.cond(self.is_training, lambda: self.func1(inputs), lambda: inputs1_default)
53 |         # 如果训练的话, 输出是损失值; 如果预测的话, 输出是相似的top_k索引
54 |         train_predict_output = tf.cond(self.is_training, lambda: self.train_output(inputs0, inputs1),
55 |                                        lambda: self.predict_output(inputs0))
56 |         return train_predict_output
57 | 
58 |     def func2(self, input_shape):
59 |         input_shape0 = input_shape[0]
60 |         return (input_shape0[0], self.top_k)
61 | 
62 |     def compute_output_shape(self, input_shape):
63 |         output_shape = tf.cond(self.is_training, lambda: (), lambda: self.func2(input_shape))
64 |         return output_shape
65 | 
66 |     def get_config(self):
67 |         config = {
68 |             'is_training': self.is_training,
69 |             'top_k': self.top_k,
70 |             'item_num': self.item_num,
71 |             'kernel_initializer': initializers.serialize(self.kernel_initializer)
72 |         }
73 |         base_config = super(SampleLayer, self).get_config()
74 |         return dict(list(base_config.items()) + list(config.items()))
75 | 
76 | if __name__ == "__main__":
77 |     inputs0 = tf.constant([[0.1, 0.2, 0.6, 0.3, 0.5], [0.8, 0.6, 0.9, 0.3, 0.5]])
78 |     inputs1 = tf.constant([0, 3])
79 |     sample_layer = SampleLayer(tf.constant(True), 3, 10, name="abc")
80 |     result = sample_layer([inputs0, inputs1])
81 |     print(result)
82 |     print(sample_layer.trainable_weights)


--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
  1 | # YouTube-DNN-RecSys: Deep Neural Networks for YouTube Recommendations
  2 | 
  3 | ## Deep Neural Networks for YouTube Recommendations
  4 | [Paper](https://dl.acm.org/doi/pdf/10.1145/2959100.2959190)
  5 | 
  6 | A clean, well-organized implementation of Deep Neural Networks for YouTube Recommendations, featuring both Python (TensorFlow) and Scala (Spark) implementations.
  7 | 
  8 | [![Ask DeepWiki](https://deepwiki.com/badge.svg)](https://deepwiki.com/chenxingqiang/YouTube-DNN-RecSys)
  9 | 
 10 | ## Achitecture
 11 | ![](architecture.drawio.svg)
 12 | 
 13 | ## 🏗️ Project Structure
 14 | 
 15 | ```
 16 | DNN-YouTube-RecSys/
 17 | ├── src/
 18 | │   ├── python/           # Python implementation using TensorFlow
 19 | │   │   ├── models/       # Core DNN model and loading utilities
 20 | │   │   ├── data/         # Data processing and TFRecords handling
 21 | │   │   ├── utils/        # TensorBoard and utility functions
 22 | │   │   ├── examples/     # Usage examples and tutorials
 23 | │   │   └── reference/    # Custom layers and feature engineering
 24 | │   └── scala/            # Scala implementation using Spark
 25 | │       ├── models/       # Feature building and embedding models
 26 | │       ├── data/         # Data generation scripts
 27 | │       ├── prediction/   # User vector and item embedding prediction
 28 | │       ├── core/         # Base Spark application classes
 29 | │       ├── examples/     # Spark usage examples
 30 | │       └── config/       # Environment configuration files
 31 | ├── data/                 # Data storage and model artifacts
 32 | │   ├── tfrecords/        # Training and evaluation data
 33 | │   └── checkpoints/      # Model checkpoints and saved models
 34 | ├── tests/                # Test suites for both Python and Scala
 35 | ├── docs/                 # Research paper and documentation
 36 | ├── requirements.txt      # Python dependencies
 37 | ├── pom.xml              # Maven configuration for Scala
 38 | └── .gitignore           # Git ignore patterns
 39 | ```
 40 | 
 41 | ## 🚀 Quick Start
 42 | 
 43 | ### Python (TensorFlow) Implementation
 44 | 
 45 | 1. **Install dependencies:**
 46 |    ```bash
 47 |    pip install -r requirements.txt
 48 |    ```
 49 | 
 50 | 2. **Train the model:**
 51 |    ```bash
 52 |    cd src/python
 53 |    python models/dnn.py
 54 |    ```
 55 | 
 56 | 3. **Run examples:**
 57 |    ```bash
 58 |    python examples/example1.py
 59 |    python examples/example2.py
 60 |    ```
 61 | 
 62 | ### Scala (Spark) Implementation
 63 | 
 64 | 1. **Build the project:**
 65 |    ```bash
 66 |    mvn clean compile
 67 |    ```
 68 | 
 69 | 2. **Run examples:**
 70 |    ```bash
 71 |    mvn exec:java -Dexec.mainClass="example.Example1"
 72 |    ```
 73 | 
 74 | ## 📚 Key Components
 75 | 
 76 | ### Python Implementation
 77 | - **`models/dnn.py`**: Core deep neural network model
 78 | - **`models/load_dnn_model.py`**: Model loading and inference utilities
 79 | - **`data/data2tfrecords.py`**: Data conversion to TFRecords format
 80 | - **`utils/tensor_board.py`**: TensorBoard integration for training visualization
 81 | 
 82 | ### Scala Implementation
 83 | - **`models/FeatureBuilder.scala`**: Feature engineering utilities
 84 | - **`prediction/PredictUserVector.scala`**: User vector prediction
 85 | - **`prediction/ItemEmbeddingPredictor.scala`**: Item embedding generation
 86 | - **`core/BaseSparkLocal.scala`**: Local Spark application base class
 87 | 
 88 | ## 🔧 Configuration
 89 | 
 90 | - **Python**: Configure via `requirements.txt` and environment variables
 91 | - **Scala**: Configure via `src/scala/config/` properties files
 92 | - **Data**: Store training data in `data/tfrecords/` directory
 93 | - **Models**: Save checkpoints in `data/checkpoints/` directory
 94 | 
 95 | ## 📖 Documentation
 96 | 
 97 | - **Research Paper**: `docs/Deep Neural Networks for YouTube Recommendations.pdf`
 98 | - **Code Examples**: See `src/python/examples/` and `src/scala/examples/`
 99 | - **Reference Implementations**: Check `src/python/reference/` for custom components
100 | 
101 | ## 🤝 Contributing
102 | 
103 | 1. Follow the established directory structure
104 | 2. Add tests in the appropriate `tests/` subdirectory
105 | 3. Update documentation for any new features
106 | 4. Ensure both Python and Scala implementations remain consistent
107 | 
108 | ## 📄 License
109 | 
110 | This project implements the research described in "Deep Neural Networks for YouTube Recommendations" paper. Please refer to the original paper for academic citations and research context.
111 | 


--------------------------------------------------------------------------------
/pom.xml:
--------------------------------------------------------------------------------
  1 | <?xml version="1.0" encoding="UTF-8"?>
  2 | <project xmlns="http://maven.apache.org/POM/4.0.0"
  3 |          xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  4 |          xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
  5 |     <modelVersion>4.0.0</modelVersion>
  6 | 
  7 |     <groupId>algorithm.cedarmo</groupId>
  8 |     <artifactId>deep_neural_networks_for_youtube_recommendations</artifactId>
  9 |     <version>1.0-SNAPSHOT</version>
 10 | 
 11 |     <properties>
 12 |         <scala.binary.version>2.11</scala.binary.version>
 13 |         <scala.version>${scala.binary.version}.8</scala.version>
 14 |         <spark.version>2.1.0</spark.version>
 15 |         <dependency>compile</dependency>
 16 |     </properties>
 17 |     <dependencies>
 18 |         <dependency>
 19 |             <groupId>org.scala-lang</groupId>
 20 |             <artifactId>scala-library</artifactId>
 21 |             <version>${scala.version}</version>
 22 |         </dependency>
 23 |         <dependency>
 24 |             <groupId>org.scala-lang</groupId>
 25 |             <artifactId>scala-compiler</artifactId>
 26 |             <version>${scala.version}</version>
 27 |         </dependency>
 28 |         <dependency>
 29 |             <groupId>commons-lang</groupId>
 30 |             <artifactId>commons-lang</artifactId>
 31 |             <version>2.5</version>
 32 |         </dependency>
 33 | 
 34 |         <dependency>
 35 |             <groupId>org.apache.hadoop</groupId>
 36 |             <artifactId>hadoop-auth</artifactId>
 37 |             <version>2.4.0</version>
 38 |         </dependency>
 39 |         <dependency>
 40 |             <groupId>commons-configuration</groupId>
 41 |             <artifactId>commons-configuration</artifactId>
 42 |             <version>1.9</version>
 43 |         </dependency>
 44 |         <dependency>
 45 |             <groupId>org.apache.spark</groupId>
 46 |             <artifactId>spark-core_${scala.binary.version}</artifactId>
 47 |             <version>${spark.version}</version>
 48 |             <!--<scope>provided</scope>-->
 49 |         </dependency>
 50 |         <dependency>
 51 |             <groupId>org.apache.spark</groupId>
 52 |             <artifactId>spark-sql_${scala.binary.version}</artifactId>
 53 |             <version>${spark.version}</version>
 54 |             <!--<scope>provided</scope>-->
 55 |         </dependency>
 56 |         <dependency>
 57 |             <groupId>org.apache.spark</groupId>
 58 |             <artifactId>spark-mllib_2.11</artifactId>
 59 |             <version>${spark.version}</version>
 60 |             <!--<scope>provided</scope>-->
 61 |         </dependency>
 62 |         <dependency>
 63 |             <groupId>org.scalanlp</groupId>
 64 |             <artifactId>breeze_2.11</artifactId>
 65 |             <version>0.13.2</version>
 66 |         </dependency>
 67 |         <dependency>
 68 |             <groupId>org.tensorflow</groupId>
 69 |             <artifactId>spark-tensorflow-connector_2.11</artifactId>
 70 |             <version>1.13.1</version>
 71 |         </dependency>
 72 |         <dependency>
 73 |             <groupId>org.tensorflow</groupId>
 74 |             <artifactId>tensorflow</artifactId>
 75 |             <version>1.13.1</version>
 76 |         </dependency>
 77 |     </dependencies>
 78 | 
 79 |     <profiles>
 80 |         <profile>
 81 |             <id>sit</id>
 82 |             <activation>
 83 |                 <activeByDefault>true</activeByDefault>
 84 |             </activation>
 85 |             <build>
 86 |                 <filters>
 87 |                     <filter>../${project.artifactId}/vars/vars.sit.properties</filter>
 88 |                 </filters>
 89 |                 <resources>
 90 |                     <resource>
 91 |                         <directory>src/main/resources</directory>
 92 |                         <filtering>true</filtering>
 93 |                     </resource>
 94 |                 </resources>
 95 |             </build>
 96 |         </profile>
 97 |         <profile>
 98 |             <id>prod</id>
 99 |             <build>
100 |                 <filters>
101 |                     <filter>../${project.artifactId}/vars/vars.prod.properties</filter>
102 |                 </filters>
103 |                 <resources>
104 |                     <resource>
105 |                         <directory>src/main/resources</directory>
106 |                         <filtering>true</filtering>
107 |                     </resource>
108 |                 </resources>
109 |             </build>
110 |         </profile>
111 |     </profiles>
112 | 
113 |     <build>
114 |         <plugins>
115 |             <plugin>
116 |                 <groupId>org.codehaus.mojo</groupId>
117 |                 <artifactId>build-helper-maven-plugin</artifactId>
118 |                 <version>1.8</version>
119 |                 <executions>
120 |                     <execution>
121 |                         <id>add-source</id>
122 |                         <phase>generate-sources</phase>
123 |                         <goals>
124 |                             <goal>add-source</goal>
125 |                         </goals>
126 |                         <configuration>
127 |                             <sources>
128 |                                 <source>src/main/scala</source>
129 |                                 <source>src/test/scala</source>
130 |                             </sources>
131 |                         </configuration>
132 |                     </execution>
133 |                     <execution>
134 |                         <id>add-test-source</id>
135 |                         <phase>generate-sources</phase>
136 |                         <goals>
137 |                             <goal>add-test-source</goal>
138 |                         </goals>
139 |                         <configuration>
140 |                             <sources>
141 |                                 <source>src/test/scala</source>
142 |                             </sources>
143 |                         </configuration>
144 |                     </execution>
145 |                 </executions>
146 |             </plugin>
147 |             <plugin>
148 |                 <groupId>net.alchim31.maven</groupId>
149 |                 <artifactId>scala-maven-plugin</artifactId>
150 |                 <version>3.1.5</version>
151 |                 <executions> <execution>
152 |                     <goals>
153 |                         <goal>compile</goal>
154 |                         <goal>testCompile</goal>
155 |                     </goals> </execution>
156 |                 </executions>
157 |                 <configuration>
158 |                     <scalaVersion>${scala.version}</scalaVersion>
159 |                 </configuration>
160 |             </plugin>
161 |             <plugin>
162 |                 <groupId>org.apache.maven.plugins</groupId>
163 |                 <artifactId>maven-compiler-plugin</artifactId>
164 |                 <configuration>
165 |                     <source>1.7</source>
166 |                     <target>1.7</target>
167 |                     <encoding>utf-8</encoding>
168 |                 </configuration>
169 |                 <executions>
170 |                     <execution>
171 |                         <phase>compile</phase>
172 |                         <goals>
173 |                             <goal>compile</goal>
174 |                         </goals>
175 |                     </execution>
176 |                 </executions>
177 |             </plugin>
178 |             <plugin>
179 |                 <artifactId>maven-assembly-plugin</artifactId>
180 |                 <configuration>
181 |                     <descriptorRefs>
182 |                         <descriptorRef>jar-with-dependencies</descriptorRef>
183 |                     </descriptorRefs>
184 |                     <archive>
185 |                         <manifest>
186 |                             <mainClass>example.Example1</mainClass>
187 |                         </manifest>
188 |                     </archive>
189 |                 </configuration>
190 |                 <executions>
191 |                     <execution>
192 |                         <id>make-assembly</id>
193 |                         <phase>package</phase>
194 |                         <goals>
195 |                             <goal>assembly</goal>
196 |                         </goals>
197 |                     </execution>
198 |                 </executions>
199 |             </plugin>
200 |         </plugins>
201 |     </build>
202 | 
203 | </project>


--------------------------------------------------------------------------------
/src/python/models/dnn.py:
--------------------------------------------------------------------------------
  1 | # -*- coding: utf-8 -*-
  2 | 
  3 | import os
  4 | import json
  5 | import tensorflow as tf
  6 | 
  7 | def parse_fn(example):
  8 |     example_fmt = {
  9 |         "visit_items_index": tf.FixedLenFeature([5], tf.int64),
 10 |         "continuous_features_value": tf.FixedLenFeature([16], tf.float32),
 11 |         "next_visit_item_index": tf.FixedLenFeature([], tf.int64)
 12 |     }
 13 |     parsed = tf.parse_single_example(example, example_fmt)
 14 |     next_visit_item_index = parsed.pop("next_visit_item_index")
 15 |     return parsed, next_visit_item_index
 16 | 
 17 | def input_fn(path, parallel_num, epoch_num, batch_size):
 18 |     files = tf.data.Dataset.list_files(path, shuffle=True)
 19 |     data_set = files.apply(
 20 |         tf.contrib.data.parallel_interleave(
 21 |             map_func=lambda filename: tf.data.TFRecordDataset(filename),
 22 |             cycle_length=parallel_num))
 23 |     data_set = data_set.repeat(epoch_num)
 24 |     data_set = data_set.map(map_func=parse_fn, num_parallel_calls=parallel_num)
 25 |     data_set = data_set.prefetch(buffer_size=256)
 26 |     data_set = data_set.batch(batch_size=batch_size)
 27 |     return data_set
 28 | 
 29 | def model_fn(features, labels, mode, params, config):
 30 | 
 31 |     visit_items_index = features["visit_items_index"]    # num * 5
 32 |     continuous_features_value = features["continuous_features_value"]  # num * 16
 33 |     next_visit_item_index = labels    # num
 34 |     keep_prob = params["keep_prob"]
 35 |     embedding_size = params["embedding_size"]
 36 |     item_num = params["item_num"]
 37 |     learning_rate = params["learning_rate"]
 38 |     top_k = params["top_k"]
 39 | 
 40 |     # items embedding 初始化
 41 |     initializer = tf.initializers.random_uniform(minval=-0.5 / embedding_size, maxval=0.5 / embedding_size)
 42 |     partitioner = tf.fixed_size_partitioner(num_shards=embedding_size)
 43 |     item_embedding = tf.get_variable("item_embedding", [item_num, embedding_size],
 44 |                                      tf.float32, initializer=initializer, partitioner=partitioner)
 45 | 
 46 |     visit_items_embedding = tf.nn.embedding_lookup(item_embedding, visit_items_index)       # num * 5 * embedding_size
 47 |     visit_items_average_embedding = tf.reduce_mean(visit_items_embedding, axis=1)     # num * embedding_size
 48 |     input_embedding = tf.concat([visit_items_average_embedding, continuous_features_value], 1)   # num * (embedding_size + 16)
 49 |     kernel_initializer_1 = tf.initializers.random_normal(mean=0.0, stddev=0.1)
 50 |     bias_initializer_1 = tf.initializers.random_normal(mean=0.0, stddev=0.1)
 51 |     layer_1 = tf.layers.dense(input_embedding, 64, activation=tf.nn.relu,
 52 |                               kernel_initializer=kernel_initializer_1,
 53 |                               bias_initializer=bias_initializer_1, name="layer_1")
 54 |     layer_dropout_1 = tf.nn.dropout(layer_1, keep_prob=keep_prob, name="layer_dropout_1")
 55 |     kernel_initializer_2 = tf.initializers.random_normal(mean=0.0, stddev=0.1)
 56 |     bias_initializer_2 = tf.initializers.random_normal(mean=0.0, stddev=0.1)
 57 |     layer_2 = tf.layers.dense(layer_dropout_1, 32, activation=tf.nn.relu,
 58 |                               kernel_initializer=kernel_initializer_2,
 59 |                               bias_initializer=bias_initializer_2, name="layer_2")
 60 |     layer_dropout_2 = tf.nn.dropout(layer_2, keep_prob=keep_prob, name="layer_dropout_2")
 61 |     # user vector, num * embedding_size
 62 |     kernel_initializer_3 = tf.initializers.random_normal(mean=0.0, stddev=0.1)
 63 |     bias_initializer_3 = tf.initializers.random_normal(mean=0.0, stddev=0.1)
 64 |     user_vector = tf.layers.dense(layer_dropout_2, embedding_size, activation=tf.nn.relu,
 65 |                                   kernel_initializer=kernel_initializer_3,
 66 |                                   bias_initializer=bias_initializer_3, name="user_vector")
 67 | 
 68 |     if mode == tf.estimator.ModeKeys.TRAIN:
 69 |         # 训练
 70 |         output_embedding = tf.nn.embedding_lookup(item_embedding, next_visit_item_index)  # num * embedding_size
 71 |         logits = tf.matmul(user_vector, output_embedding, transpose_a=False, transpose_b=True)  # num * num
 72 |         yhat = tf.nn.softmax(logits)  # num * num
 73 |         cross_entropy = tf.reduce_mean(-tf.log(tf.matrix_diag_part(yhat) + 1e-16))
 74 |         optimizer = tf.train.GradientDescentOptimizer(learning_rate)
 75 |         train = optimizer.minimize(cross_entropy, global_step=tf.train.get_global_step())
 76 |         return tf.estimator.EstimatorSpec(mode, loss=cross_entropy, train_op=train)
 77 | 
 78 |     if mode == tf.estimator.ModeKeys.EVAL:
 79 |         # 评估
 80 |         output_embedding = tf.nn.embedding_lookup(item_embedding, next_visit_item_index)  # num * embedding_size
 81 |         logits = tf.matmul(user_vector, output_embedding, transpose_a=False, transpose_b=True)  # num * num
 82 |         yhat = tf.nn.softmax(logits)  # num * num
 83 |         cross_entropy = tf.reduce_mean(-tf.log(tf.matrix_diag_part(yhat) + 1e-16))
 84 |         return tf.estimator.EstimatorSpec(mode, loss=cross_entropy)
 85 | 
 86 |     if mode == tf.estimator.ModeKeys.PREDICT:
 87 |         logits_predict = tf.matmul(user_vector, item_embedding, transpose_a=False, transpose_b=True)  # num *  item_num
 88 |         yhat_predict = tf.nn.softmax(logits_predict)  # num *  item_num
 89 |         _, indices = tf.nn.top_k(yhat_predict, k=top_k, sorted=True)
 90 |         index = tf.identity(indices, name="index")  # num * top_k
 91 |         # 预测
 92 |         predictions = {
 93 |             "user_vector": user_vector,
 94 |             "index": index
 95 |         }
 96 |         export_outputs = {
 97 |             "prediction": tf.estimator.export.PredictOutput(predictions)
 98 |         }
 99 |         return tf.estimator.EstimatorSpec(mode, predictions=predictions, export_outputs=export_outputs)
100 | 
101 | def build_estimator():
102 |     params = {"keep_prob": 0.5, "embedding_size": 16, "item_num": 500, "learning_rate": 0.05, "top_k": 2}
103 |     session_config = tf.ConfigProto(device_count={"CPU": 1}, allow_soft_placement=True, log_device_placement=False)
104 |     session_config.gpu_options.allow_growth = True
105 |     config = tf.estimator.RunConfig(
106 |         model_dir="../../data/checkpoints/ckpt",
107 |         tf_random_seed=2019,
108 |         save_checkpoints_steps=100,
109 |         session_config=session_config,
110 |         keep_checkpoint_max=5,
111 |         log_step_count_steps=100
112 |     )
113 |     estimator = tf.estimator.Estimator(model_fn=model_fn, config=config, params=params)
114 |     return estimator
115 | 
116 | def set_dist_env():
117 |     if FLAGS.is_distributed:
118 |         ps_hosts = FLAGS.strps_hosts.split(",")
119 |         worker_hosts = FLAGS.strwork_hosts.split(",")
120 |         job_name = FLAGS.job_name
121 |         task_index = FLAGS.task_index
122 |         chief_hosts = worker_hosts[0:1]  # get first worker as chief
123 |         worker_hosts = worker_hosts[2:]  # the rest as worker
124 | 
125 |         # use #worker=0 as chief
126 |         if job_name == "worker" and task_index == 0:
127 |             job_name = "chief"
128 |         # use #worker=1 as evaluator
129 |         if job_name == "worker" and task_index == 1:
130 |             job_name = 'evaluator'
131 |             task_index = 0
132 |         # the others as worker
133 |         if job_name == "worker" and task_index > 1:
134 |             task_index -= 2
135 | 
136 |         tf_config = {'cluster': {'chief': chief_hosts, 'worker': worker_hosts, 'ps': ps_hosts},
137 |                      'task': {'type': job_name, 'index': task_index}}
138 |         os.environ['TF_CONFIG'] = json.dumps(tf_config)
139 | 
140 | def train_eval_save():
141 | 
142 |     set_dist_env()
143 | 
144 |     estimator = build_estimator()
145 | 
146 |     # 训练
147 |     train_spec = tf.estimator.TrainSpec(
148 |         input_fn=lambda: input_fn(
149 |             path='../../data/tfrecords/train/train.tfrecords',
150 |             parallel_num=32,
151 |             epoch_num=11,
152 |             batch_size=32),
153 |         max_steps=1600
154 |     )
155 |     # 评估
156 |     eval_spec = tf.estimator.EvalSpec(
157 |         input_fn=lambda: input_fn(
158 |             path='../../data/tfrecords/evaluation/evaluation.tfrecords',
159 |             parallel_num=32,
160 |             epoch_num=1,
161 |             batch_size=32),
162 |         steps=15,     # 验证集评估多少批数据
163 |         start_delay_secs=1,    # 在多少秒后 start_delay_secs=1,    # 在多少秒后
164 |         throttle_secs=20  # evaluate every 20seconds
165 |     )
166 |     # 训练和评估
167 |     tf.estimator.train_and_evaluate(estimator, train_spec, eval_spec)
168 | 
169 |     # 模型保存
170 |     features_spec = {
171 |         "visit_items_index": tf.placeholder(tf.int64, shape=[None, 5], name="visit_items_index"),
172 |         "continuous_features_value": tf.placeholder(tf.float32, shape=[None, 16], name="continuous_features_value")
173 |     }
174 |     serving_input_receiver_fn = tf.estimator.export.build_raw_serving_input_receiver_fn(features_spec)
175 |     estimator.export_savedmodel(
176 |         "../../data/checkpoints/modelpath",
177 |         serving_input_receiver_fn)
178 | 
179 | def main(_):
180 |     train_eval_save()
181 | 
182 | if __name__ == "__main__":
183 |     tf.logging.set_verbosity(tf.logging.INFO)
184 |     FLAGS = tf.app.flags.FLAGS
185 |     tf.app.flags.DEFINE_boolean("is_distributed", False, "是否分布式训练")
186 |     tf.app.flags.DEFINE_string("strps_hosts", "localhost:2000", "参数服务器")
187 |     tf.app.flags.DEFINE_string("strwork_hosts", "localhost:2100,localhost:2200,localhost:2300,localhost:2400", "工作服务器")
188 |     tf.app.flags.DEFINE_string("job_name", "ps", "参数服务器或者工作服务器")
189 |     tf.app.flags.DEFINE_integer("task_index", 0, "job的task索引")
190 |     tf.app.run(main=main)


--------------------------------------------------------------------------------
/docs/architecture.drawio:
--------------------------------------------------------------------------------
  1 | <mxfile host="Electron" agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) draw.io/29.0.3 Chrome/140.0.7339.249 Electron/38.7.0 Safari/537.36" version="29.0.3">
  2 |   <diagram name="YouTube DNN RecSys Architecture" id="architecture">
  3 |     <mxGraphModel dx="1412" dy="1208" grid="1" gridSize="10" guides="1" tooltips="1" connect="1" arrows="1" fold="1" page="1" pageScale="1" pageWidth="1600" pageHeight="1200" math="0" shadow="0">
  4 |       <root>
  5 |         <mxCell id="0" />
  6 |         <mxCell id="1" parent="0" />
  7 |         <mxCell id="title" value="YouTube DNN 推荐系统架构" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=24;fontStyle=1" parent="1" vertex="1">
  8 |           <mxGeometry x="600" y="40" width="400" height="40" as="geometry" />
  9 |         </mxCell>
 10 |         <mxCell id="data-layer-bg" value="" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#E1F5FE;strokeColor=#01579B;strokeWidth=2;" parent="1" vertex="1">
 11 |           <mxGeometry x="80" y="120" width="680" height="240" as="geometry" />
 12 |         </mxCell>
 13 |         <mxCell id="data-layer-title" value="数据处理层 (Data Processing Layer)" style="text;html=1;strokeColor=none;fillColor=none;align=left;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=16;fontStyle=1" parent="1" vertex="1">
 14 |           <mxGeometry x="100" y="130" width="320" height="30" as="geometry" />
 15 |         </mxCell>
 16 |         <mxCell id="python-data" value="" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FFF3E0;strokeColor=#E65100;strokeWidth=2;" parent="1" vertex="1">
 17 |           <mxGeometry x="120" y="180" width="280" height="150" as="geometry" />
 18 |         </mxCell>
 19 |         <mxCell id="python-data-title" value="Python 数据处理" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=14;fontStyle=1" parent="1" vertex="1">
 20 |           <mxGeometry x="120" y="185" width="280" height="25" as="geometry" />
 21 |         </mxCell>
 22 |         <mxCell id="data2tfrecords" value="data2tfrecords.py&lt;br&gt;• 生成随机训练数据&lt;br&gt;• 转换为 TFRecords 格式&lt;br&gt;• 训练/评估数据集" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FFFFFF;strokeColor=#E65100;align=left;verticalAlign=middle;fontSize=12;spacingLeft=10;" parent="1" vertex="1">
 23 |           <mxGeometry x="140" y="220" width="240" height="90" as="geometry" />
 24 |         </mxCell>
 25 |         <mxCell id="scala-data" value="" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#F3E5F5;strokeColor=#4A148C;strokeWidth=2;" parent="1" vertex="1">
 26 |           <mxGeometry x="440" y="180" width="280" height="150" as="geometry" />
 27 |         </mxCell>
 28 |         <mxCell id="scala-data-title" value="Scala + Spark 数据处理" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=14;fontStyle=1" parent="1" vertex="1">
 29 |           <mxGeometry x="440" y="185" width="280" height="25" as="geometry" />
 30 |         </mxCell>
 31 |         <mxCell id="makedata" value="MakeDataOne.scala&#xa;MakeDataTwo.scala&#xa;&#xa;• Spark 分布式数据生成&#xa;• TFRecords 格式输出&#xa;• HDFS 存储支持" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FFFFFF;strokeColor=#4A148C;align=center;verticalAlign=middle;fontSize=12;spacingLeft=10;" parent="1" vertex="1">
 32 |           <mxGeometry x="460" y="220" width="240" height="90" as="geometry" />
 33 |         </mxCell>
 34 |         <mxCell id="storage-layer-bg" value="" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#F1F8E9;strokeColor=#33691E;strokeWidth=2;" parent="1" vertex="1">
 35 |           <mxGeometry x="840" y="120" width="680" height="240" as="geometry" />
 36 |         </mxCell>
 37 |         <mxCell id="storage-layer-title" value="存储层 (Storage Layer)" style="text;html=1;strokeColor=none;fillColor=none;align=left;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=16;fontStyle=1" parent="1" vertex="1">
 38 |           <mxGeometry x="860" y="130" width="240" height="30" as="geometry" />
 39 |         </mxCell>
 40 |         <mxCell id="tfrecords-storage" value="TFRecords 数据存储&#xa;&#xa;data/tfrecords/&#xa;  ├─ train/&#xa;  │   └─ train.tfrecords&#xa;  └─ evaluation/&#xa;      └─ evaluation.tfrecords" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FFFFFF;strokeColor=#33691E;align=left;verticalAlign=top;fontSize=12;spacingLeft=10;spacingTop=10;fontFamily=Courier New;" parent="1" vertex="1">
 41 |           <mxGeometry x="880" y="180" width="280" height="150" as="geometry" />
 42 |         </mxCell>
 43 |         <mxCell id="checkpoint-storage" value="模型 Checkpoint 存储&#xa;&#xa;data/checkpoints/&#xa;  ├─ ckpt/&#xa;  │   ├─ checkpoint&#xa;  │   └─ eval/&#xa;  └─ modelpath/" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FFFFFF;strokeColor=#33691E;align=left;verticalAlign=top;fontSize=12;spacingLeft=10;spacingTop=10;fontFamily=Courier New;" parent="1" vertex="1">
 44 |           <mxGeometry x="1200" y="180" width="280" height="150" as="geometry" />
 45 |         </mxCell>
 46 |         <mxCell id="model-layer-bg" value="" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FCE4EC;strokeColor=#880E4F;strokeWidth=2;" parent="1" vertex="1">
 47 |           <mxGeometry x="80" y="420" width="680" height="340" as="geometry" />
 48 |         </mxCell>
 49 |         <mxCell id="model-layer-title" value="模型训练层 (Model Training Layer)" style="text;html=1;strokeColor=none;fillColor=none;align=left;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=16;fontStyle=1" parent="1" vertex="1">
 50 |           <mxGeometry x="100" y="430" width="320" height="30" as="geometry" />
 51 |         </mxCell>
 52 |         <mxCell id="dnn-model" value="" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FFFFFF;strokeColor=#880E4F;strokeWidth=2;" parent="1" vertex="1">
 53 |           <mxGeometry x="120" y="480" width="600" height="250" as="geometry" />
 54 |         </mxCell>
 55 |         <mxCell id="dnn-title" value="dnn.py - TensorFlow DNN 模型" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=14;fontStyle=1" parent="1" vertex="1">
 56 |           <mxGeometry x="120" y="485" width="600" height="25" as="geometry" />
 57 |         </mxCell>
 58 |         <mxCell id="input-layer" value="输入层&lt;br&gt;• visit_items_index (5 items)&lt;br&gt;• continuous_features (16 dims)" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#E3F2FD;strokeColor=#1565C0;align=center;verticalAlign=middle;fontSize=12;" parent="1" vertex="1">
 59 |           <mxGeometry x="150" y="530" width="200" height="80" as="geometry" />
 60 |         </mxCell>
 61 |         <mxCell id="embedding-layer" value="Embedding 层&lt;br&gt;• Item Embedding (500 items)&lt;br&gt;• Embedding Size: 16&lt;br&gt;• Average Pooling" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#E8F5E9;strokeColor=#2E7D32;align=center;verticalAlign=middle;fontSize=12;" parent="1" vertex="1">
 62 |           <mxGeometry x="150" y="630" width="200" height="80" as="geometry" />
 63 |         </mxCell>
 64 |         <mxCell id="dnn-layers" value="DNN 网络层&lt;br&gt;• Dense Layer 1: 64 units + ReLU&lt;br&gt;• Dropout Layer&lt;br&gt;• Dense Layer 2: 32 units + ReLU&lt;br&gt;• Dropout Layer&lt;br&gt;• User Vector: 16 dims + ReLU" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FFF9C4;strokeColor=#F57F17;align=left;verticalAlign=middle;fontSize=12;spacingLeft=10;" parent="1" vertex="1">
 65 |           <mxGeometry x="380" y="530" width="310" height="100" as="geometry" />
 66 |         </mxCell>
 67 |         <mxCell id="output-layer" value="输出层&lt;br&gt;• Softmax 分类 (500 classes)&lt;br&gt;• Cross Entropy Loss&lt;br&gt;• Top-K 推荐结果" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FFE0B2;strokeColor=#E65100;align=center;verticalAlign=middle;fontSize=12;" parent="1" vertex="1">
 68 |           <mxGeometry x="380" y="650" width="310" height="60" as="geometry" />
 69 |         </mxCell>
 70 |         <mxCell id="prediction-layer-bg" value="" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#EDE7F6;strokeColor=#311B92;strokeWidth=2;" parent="1" vertex="1">
 71 |           <mxGeometry x="840" y="420" width="680" height="340" as="geometry" />
 72 |         </mxCell>
 73 |         <mxCell id="prediction-layer-title" value="预测服务层 (Prediction Layer)" style="text;html=1;strokeColor=none;fillColor=none;align=left;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=16;fontStyle=1" parent="1" vertex="1">
 74 |           <mxGeometry x="860" y="430" width="320" height="30" as="geometry" />
 75 |         </mxCell>
 76 |         <mxCell id="user-vector-prediction" value="" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FFFFFF;strokeColor=#311B92;strokeWidth=2;" parent="1" vertex="1">
 77 |           <mxGeometry x="880" y="480" width="280" height="130" as="geometry" />
 78 |         </mxCell>
 79 |         <mxCell id="user-vector-title" value="用户向量预测" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=14;fontStyle=1" parent="1" vertex="1">
 80 |           <mxGeometry x="880" y="485" width="280" height="25" as="geometry" />
 81 |         </mxCell>
 82 |         <mxCell id="predict-user-vector" value="PredictUserVector.scala&lt;br&gt;• 加载 SavedModel&lt;br&gt;• Spark 分布式预测&lt;br&gt;• 生成用户向量&lt;br&gt;  (embedding_average → user_vector)" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#E8EAF6;strokeColor=#311B92;align=left;verticalAlign=middle;fontSize=12;spacingLeft=10;" parent="1" vertex="1">
 83 |           <mxGeometry x="900" y="520" width="240" height="75" as="geometry" />
 84 |         </mxCell>
 85 |         <mxCell id="item-embedding-prediction" value="" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FFFFFF;strokeColor=#311B92;strokeWidth=2;" parent="1" vertex="1">
 86 |           <mxGeometry x="1200" y="480" width="280" height="130" as="geometry" />
 87 |         </mxCell>
 88 |         <mxCell id="item-embedding-title" value="物品 Embedding 预测" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=14;fontStyle=1" parent="1" vertex="1">
 89 |           <mxGeometry x="1200" y="485" width="280" height="25" as="geometry" />
 90 |         </mxCell>
 91 |         <mxCell id="item-embedding-predictor" value="ItemEmbeddingPredictor.scala&lt;br&gt;• 加载 SavedModel&lt;br&gt;• 提取 Item Embedding&lt;br&gt;• 特征工程 (FeatureBuilder)&lt;br&gt;• 支持多特征输入" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#E8EAF6;strokeColor=#311B92;align=left;verticalAlign=top;fontSize=12;spacingLeft=10;" parent="1" vertex="1">
 92 |           <mxGeometry x="1220" y="520" width="240" height="75" as="geometry" />
 93 |         </mxCell>
 94 |         <mxCell id="model-loading" value="" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FFFFFF;strokeColor=#311B92;strokeWidth=2;" parent="1" vertex="1">
 95 |           <mxGeometry x="880" y="640" width="600" height="100" as="geometry" />
 96 |         </mxCell>
 97 |         <mxCell id="model-loading-title" value="模型加载与推理" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=14;fontStyle=1" parent="1" vertex="1">
 98 |           <mxGeometry x="880" y="645" width="600" height="25" as="geometry" />
 99 |         </mxCell>
100 |         <mxCell id="load-dnn-model" value="load_dnn_model.py - Python 模型加载与推理&#xa;• TensorFlow SavedModel 加载   • 在线推理服务   • 批量预测" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#E8EAF6;strokeColor=#311B92;align=left;verticalAlign=middle;fontSize=12;spacingLeft=10;" parent="1" vertex="1">
101 |           <mxGeometry x="900" y="680" width="560" height="45" as="geometry" />
102 |         </mxCell>
103 |         <mxCell id="utils-layer-bg" value="" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#EFEBE9;strokeColor=#3E2723;strokeWidth=2;" parent="1" vertex="1">
104 |           <mxGeometry x="80" y="820" width="1440" height="140" as="geometry" />
105 |         </mxCell>
106 |         <mxCell id="utils-layer-title" value="工具与辅助层 (Utilities &amp; Support)" style="text;html=1;strokeColor=none;fillColor=none;align=left;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=16;fontStyle=1" parent="1" vertex="1">
107 |           <mxGeometry x="100" y="830" width="360" height="30" as="geometry" />
108 |         </mxCell>
109 |         <mxCell id="tensorboard" value="TensorBoard&lt;br&gt;tensor_board.py&lt;br&gt;训练可视化" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FFFFFF;strokeColor=#3E2723;align=center;verticalAlign=middle;fontSize=12;" parent="1" vertex="1">
110 |           <mxGeometry x="120" y="875" width="200" height="65" as="geometry" />
111 |         </mxCell>
112 |         <mxCell id="feature-column" value="Feature Engineering&lt;br&gt;feature_column.py&lt;br&gt;特征列定义" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FFFFFF;strokeColor=#3E2723;align=center;verticalAlign=middle;fontSize=12;" parent="1" vertex="1">
113 |           <mxGeometry x="360" y="875" width="200" height="65" as="geometry" />
114 |         </mxCell>
115 |         <mxCell id="custom-layer" value="Custom Layers&lt;br&gt;self_defined_network_layer.py&lt;br&gt;自定义网络层" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FFFFFF;strokeColor=#3E2723;align=center;verticalAlign=middle;fontSize=12;" parent="1" vertex="1">
116 |           <mxGeometry x="600" y="875" width="240" height="65" as="geometry" />
117 |         </mxCell>
118 |         <mxCell id="spark-base" value="Spark Base Classes&lt;br&gt;BaseSparkLocal.scala&lt;br&gt;BaseSparkOnline.scala&lt;br&gt;Spark 应用基类" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FFFFFF;strokeColor=#3E2723;align=center;verticalAlign=middle;fontSize=12;" parent="1" vertex="1">
119 |           <mxGeometry x="880" y="875" width="240" height="65" as="geometry" />
120 |         </mxCell>
121 |         <mxCell id="config" value="Configuration&lt;br&gt;vars.prod.properties&lt;br&gt;vars.sit.properties&lt;br&gt;环境配置" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FFFFFF;strokeColor=#3E2723;align=center;verticalAlign=middle;fontSize=12;" parent="1" vertex="1">
122 |           <mxGeometry x="1160" y="875" width="240" height="65" as="geometry" />
123 |         </mxCell>
124 |         <mxCell id="arrow1" value="" style="endArrow=classic;html=1;rounded=0;strokeWidth=3;strokeColor=#01579B;exitX=1;exitY=0.5;exitDx=0;exitDy=0;entryX=0;entryY=0.5;entryDx=0;entryDy=0;" parent="1" source="python-data" target="tfrecords-storage" edge="1">
125 |           <mxGeometry width="50" height="50" relative="1" as="geometry">
126 |             <mxPoint x="420" y="255" as="sourcePoint" />
127 |             <mxPoint x="860" y="255" as="targetPoint" />
128 |             <Array as="points">
129 |               <mxPoint x="430" y="255" />
130 |               <mxPoint x="430" y="140" />
131 |               <mxPoint x="610" y="140" />
132 |               <mxPoint x="800" y="140" />
133 |               <mxPoint x="800" y="255" />
134 |             </Array>
135 |           </mxGeometry>
136 |         </mxCell>
137 |         <mxCell id="arrow1-label" value="生成 TFRecords" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=12;fontStyle=1" parent="1" vertex="1">
138 |           <mxGeometry x="530" y="200" width="120" height="20" as="geometry" />
139 |         </mxCell>
140 |         <mxCell id="arrow2" value="" style="endArrow=classic;html=1;rounded=0;strokeWidth=3;strokeColor=#4A148C;exitX=1;exitY=0.5;exitDx=0;exitDy=0;entryX=0;entryY=0.5;entryDx=0;entryDy=0;" parent="1" source="scala-data" target="tfrecords-storage" edge="1">
141 |           <mxGeometry width="50" height="50" relative="1" as="geometry">
142 |             <mxPoint x="740" y="255" as="sourcePoint" />
143 |             <mxPoint x="860" y="255" as="targetPoint" />
144 |           </mxGeometry>
145 |         </mxCell>
146 |         <mxCell id="arrow2-label" value="Spark 生成" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=12;fontStyle=1" parent="1" vertex="1">
147 |           <mxGeometry x="750" y="270" width="100" height="20" as="geometry" />
148 |         </mxCell>
149 |         <mxCell id="arrow3" value="" style="endArrow=classic;html=1;rounded=0;strokeWidth=3;strokeColor=#880E4F;exitX=0.5;exitY=0;exitDx=0;exitDy=0;entryX=0.25;entryY=1;entryDx=0;entryDy=0;" parent="1" source="dnn-model" target="tfrecords-storage" edge="1">
150 |           <mxGeometry width="50" height="50" relative="1" as="geometry">
151 |             <mxPoint x="420" y="480" as="sourcePoint" />
152 |             <mxPoint x="950" y="360" as="targetPoint" />
153 |             <Array as="points">
154 |               <mxPoint x="420" y="400" />
155 |               <mxPoint x="950" y="400" />
156 |             </Array>
157 |           </mxGeometry>
158 |         </mxCell>
159 |         <mxCell id="arrow3-label" value="读取训练数据" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=12;fontStyle=1" parent="1" vertex="1">
160 |           <mxGeometry x="490" y="375" width="110" height="20" as="geometry" />
161 |         </mxCell>
162 |         <mxCell id="arrow4" value="" style="endArrow=classic;html=1;rounded=0;strokeWidth=3;strokeColor=#880E4F;exitX=0.5;exitY=0;exitDx=0;exitDy=0;entryX=0.25;entryY=1;entryDx=0;entryDy=0;" parent="1" source="dnn-title" target="checkpoint-storage" edge="1">
163 |           <mxGeometry width="50" height="50" relative="1" as="geometry">
164 |             <mxPoint x="720" y="605" as="sourcePoint" />
165 |             <mxPoint x="1200" y="293" as="targetPoint" />
166 |             <Array as="points">
167 |               <mxPoint x="420" y="400" />
168 |               <mxPoint x="840" y="400" />
169 |               <mxPoint x="1230" y="400" />
170 |               <mxPoint x="1270" y="400" />
171 |             </Array>
172 |           </mxGeometry>
173 |         </mxCell>
174 |         <mxCell id="arrow4-label" value="保存模型" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=12;fontStyle=1" parent="1" vertex="1">
175 |           <mxGeometry x="1090" y="435" width="80" height="20" as="geometry" />
176 |         </mxCell>
177 |         <mxCell id="arrow5" value="" style="endArrow=classic;html=1;rounded=0;strokeWidth=3;strokeColor=#311B92;exitX=1;exitY=0.5;exitDx=0;exitDy=0;entryX=0.75;entryY=1;entryDx=0;entryDy=0;" parent="1" source="user-vector-prediction" target="checkpoint-storage" edge="1">
178 |           <mxGeometry width="50" height="50" relative="1" as="geometry">
179 |             <mxPoint x="1020" y="480" as="sourcePoint" />
180 |             <mxPoint x="1410" y="330" as="targetPoint" />
181 |             <Array as="points">
182 |               <mxPoint x="1190" y="545" />
183 |               <mxPoint x="1190" y="470" />
184 |               <mxPoint x="1190" y="450" />
185 |               <mxPoint x="1210" y="450" />
186 |               <mxPoint x="1410" y="450" />
187 |             </Array>
188 |           </mxGeometry>
189 |         </mxCell>
190 |         <mxCell id="arrow5-label" value="加载模型" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=12;fontStyle=1" parent="1" vertex="1">
191 |           <mxGeometry x="1140" y="375" width="80" height="20" as="geometry" />
192 |         </mxCell>
193 |         <mxCell id="arrow6" value="" style="endArrow=classic;html=1;rounded=0;strokeWidth=3;strokeColor=#311B92;exitX=1;exitY=0.5;exitDx=0;exitDy=0;entryX=1;entryY=0.75;entryDx=0;entryDy=0;" parent="1" source="item-embedding-prediction" target="checkpoint-storage" edge="1">
194 |           <mxGeometry width="50" height="50" relative="1" as="geometry">
195 |             <mxPoint x="1340" y="480" as="sourcePoint" />
196 |             <mxPoint x="1480" y="293" as="targetPoint" />
197 |             <Array as="points">
198 |               <mxPoint x="1550" y="545" />
199 |               <mxPoint x="1550" y="480" />
200 |               <mxPoint x="1550" y="400" />
201 |               <mxPoint x="1550" y="293" />
202 |             </Array>
203 |           </mxGeometry>
204 |         </mxCell>
205 |         <mxCell id="arrow6-label" value="加载模型" style="text;html=1;strokeColor=none;fillColor=none;align=center;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=12;fontStyle=1" parent="1" vertex="1">
206 |           <mxGeometry x="1320" y="375" width="80" height="20" as="geometry" />
207 |         </mxCell>
208 |         <mxCell id="legend-bg" value="" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FAFAFA;strokeColor=#757575;strokeWidth=2;dashed=1;" parent="1" vertex="1">
209 |           <mxGeometry x="80" y="1000" width="1440" height="140" as="geometry" />
210 |         </mxCell>
211 |         <mxCell id="legend-title" value="图例 (Legend)" style="text;html=1;strokeColor=none;fillColor=none;align=left;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=16;fontStyle=1" parent="1" vertex="1">
212 |           <mxGeometry x="100" y="1010" width="160" height="30" as="geometry" />
213 |         </mxCell>
214 |         <mxCell id="legend-python" value="Python / TensorFlow" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FFF3E0;strokeColor=#E65100;align=center;verticalAlign=middle;fontSize=12;fontStyle=1" parent="1" vertex="1">
215 |           <mxGeometry x="120" y="1055" width="180" height="40" as="geometry" />
216 |         </mxCell>
217 |         <mxCell id="legend-scala" value="Scala / Spark" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#F3E5F5;strokeColor=#4A148C;align=center;verticalAlign=middle;fontSize=12;fontStyle=1" parent="1" vertex="1">
218 |           <mxGeometry x="330" y="1055" width="180" height="40" as="geometry" />
219 |         </mxCell>
220 |         <mxCell id="legend-storage" value="存储 / Storage" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#F1F8E9;strokeColor=#33691E;align=center;verticalAlign=middle;fontSize=12;fontStyle=1" parent="1" vertex="1">
221 |           <mxGeometry x="540" y="1055" width="180" height="40" as="geometry" />
222 |         </mxCell>
223 |         <mxCell id="legend-model" value="模型训练 / Training" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#FCE4EC;strokeColor=#880E4F;align=center;verticalAlign=middle;fontSize=12;fontStyle=1" parent="1" vertex="1">
224 |           <mxGeometry x="750" y="1055" width="180" height="40" as="geometry" />
225 |         </mxCell>
226 |         <mxCell id="legend-prediction" value="预测服务 / Prediction" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#EDE7F6;strokeColor=#311B92;align=center;verticalAlign=middle;fontSize=12;fontStyle=1" parent="1" vertex="1">
227 |           <mxGeometry x="960" y="1055" width="180" height="40" as="geometry" />
228 |         </mxCell>
229 |         <mxCell id="legend-utils" value="工具辅助 / Utils" style="rounded=1;whiteSpace=wrap;html=1;fillColor=#EFEBE9;strokeColor=#3E2723;align=center;verticalAlign=middle;fontSize=12;fontStyle=1" parent="1" vertex="1">
230 |           <mxGeometry x="1170" y="1055" width="180" height="40" as="geometry" />
231 |         </mxCell>
232 |         <mxCell id="legend-note" value="注：该架构实现了 YouTube DNN 推荐系统，支持 Python (TensorFlow) 和 Scala (Spark) 双栈实现&#xa;核心流程：数据生成 → TFRecords 存储 → DNN 模型训练 → 模型保存 → Spark 分布式预测" style="text;html=1;strokeColor=none;fillColor=none;align=left;verticalAlign=middle;whiteSpace=wrap;rounded=0;fontSize=11;fontStyle=2" parent="1" vertex="1">
233 |           <mxGeometry x="120" y="1105" width="1230" height="25" as="geometry" />
234 |         </mxCell>
235 |       </root>
236 |     </mxGraphModel>
237 |   </diagram>
238 | </mxfile>
239 | 


--------------------------------------------------------------------------------